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VERSCHIEDENE BEMERKUNGEN ELEMENTARER NATUR 
UBER DIE GRUNDPOLYNOME, DIE BEI DEN-PARABOLISCHEN 
INTERPOLATIONEN AUFTRETEN 


Von 
LEOPOLD FEJER (Budapest), Mitglied der Akademie 


GAsor Szecé gewidmet zu seinem 60-sten Geburtstage 


Einleitung 


1. Die Aufgabe der parabolischen Interpolation besteht bekanntlich in 
der Bestimmung einer ganzen rationalen Funktion der unabhangigen Variabel x, 
deren Wert an den beliebig vorgeschriebenen Stellen x,,x,,...,x,, die aber 
voneinander verschieden sind, der Reihe nach, die beliebig vorgeschriebenen 
Werte y,, ¥2,--., Jn annimmt; weiter kénnen, an den Stellen x,,%,...,Xy,- 
ftir die gesuchte ganze rationale Funktion eventuell noch einige Ableitungs- 
werte bis zu einer gegebenen Ordnung vorgeschrieben werden. 


2. In dieser Note beschaftige ich mich mit den beiden elementarsten 
Fallen parabolischer Interpolation: mit der ,Lagrange“-schen und mit der 
»Hermite“-schen Interpolation. Bei der Lagrangeschen Interpolation sind fiir 
die gesuchte ganze rationale Funktion nur ihre Werte y,,y,...,y, an den 
Interpolationsstellen x,,x,,..., xX, vorgeschrieben, und es wird gefordert, dab 
sie von héchstens (n—1)-tem Grade sei. Hingegen werden bei der Hermite- 
schen Interpolation fiir die gesuchte ganze rationale Funktion aufer den 
Funktionswerten y,, y.,..., ¥, noch sdmtliche erste Ableitungswerte y;, yo,..., ¥/, 
vorgeschrieben, und es wird weiter gefordert, dafi das Interpolationspolynom 
von héchstens (2n—1)-tem Grade sei. 

Fiir beide Aufgaben gibt es tatsachlich ein den Forderungen entsprechen- 
des Polynom, u.zw. nur ein einziges. Ubrigens lautet die Lagrangesche 
Interpolationsformel 
—() L(x) = Vib (X) + Vober + FInd) 
und die Hermitesche | 
(2) H(x)=yih(x) + Yo hts (x) + +++ + Ynltn(X) + Vidi (X) +92 ho(X) ++ + Yn u(x). 

Hier wird /,(x) das k-te Grundpolynom (oder Grundfunktion) von Lag- 
range genannt und ist diejenige (einzige) ganze rationale Funktion von genau 
(n—1)-tem Grade, die an der k-ten Interpolationsstelle x, den Wert 1 an- 
nimmt, an allen iibrigen Interpolationsstellen aber verschwindet. Weiter ist 
hy,(x) die k-te Grundfunktion ersfer Art der Hermiteschen Interpolation, die 
im allgemeinen von héchstens (2n—1)-tem Grade sein soll, aber eventuell 
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auch von (2n—2)-tem Grade sein kann, die an der Stelle x, ebenfalls den 
Wert 1 annimmt, an. allen iibrigen Interpolationsstellen verschwindet, und 
deren Ableitung an allen Interpolationsstellen verschwindet. Es gibt nur eine 
einzige g.r. Funktion, die diesen Forderungen geniige leistet. 

Obzwar ich mich in dieser Einleitung auf die Grundpolynome zweiter 
Art (x) nicht ausbreiten werde, mdchte ich doch schon hier erwaéhnen, daf 
sie diejenige (einzige) g.r. Funktion von genau (2n—1)-tem Grade bedeutet, 
die an sdmtlichen Interpolationsstellen x,,%,...,X, verschwindet, deren erste 
Ableitung an der Stelle x, den Wert 1 hat, und an allen iibrigen Interpola- 
tionsstellen verschwindet. 


3. Fragen der Approximierbarkeit einer beliebigen stetigen Funktion am 
Wege der Interpolation haben dazu gefiihrt, den Verlauf dieser soeben 
erwahnten Grundpolynome etwas nadher zu untersuchen. Wenn es nun ein 
Intervall a= x= 6 gibt, das x,, X%,...,X, einschlieSt und in dessen Inneren 
a<x<b keines der Grundpolynome erster Art /,.(x) negativ wird (in welchem 
Falle man die Verteilung der Interpolationsstellen im Intervalle a= x= 6 als 
,normal“ bezeichnet), so kann man, in angedeuteter Weise, mit Hilfe der 
Identitat 
(3) hy (x) 4+- fa (x) + +++ +A, (x) = 1 
(die man erhalt, wenn man y,—yj.==---y,—1 wahlt) gleich einen grofen 
Schritt weiterkommen. Man erhalt namlich aus ihr, dafi irgendein A,(x), das 
also, wie gesagt, an der Stelle xx, den Wert 1 annimmt, im ganzen Inter- 
valle a= x =b den Wert 1 nicht tiberschreiten kann, ja man erhalt in diesem 
speziellen Falle, da sogar die Summe aller h(x) und an jeder Stelle x des 
ganzen Intervalles a= x= 6 den Wert 1 nicht iiberschreiten kann. hj(x;.)=1 
ist also jedenfalls ein Maximum von /,(x) fiir das ganze Intervall a=x=b. 


4. Lassen wir jetzt wieder fallen die Beschrénkung der ,Normalitat“ 
der Verteilung. Wir fragen: ist dann fiir 4.(x) wenigstens soviel wahr, dai 
fi.(x) fiir x-— x, ein Umgebungsmaximum hat? Die Frage ist zu bejahen. 
Es gilt folgender allgemeiner 


SATZ 1. Sind x,, X),...,X, beliebige voneinander verschiedene reelle Zah- 
len (Interpolationsstellen), und bezeichnet h(x) diejenige ganze rationale Funk- 
tion von (2n—1)-tem oder (2n—2)-tem Grade, die an der Stelle x, den 
Wert 1 besitzt, sonst an allen iibrigen Interpolationsstellen verschwindet, und— 
deren erste Ableitung an sdmtlichen Interpolationsstellen verschwindet, dann 
hat ly.(x) an der Stelle x-—x, ein ,wirkliches“ Umgebungsmaximum. 


Wenn 
(4) (X—X,) (XX) *++ (X—Xn) = w(x) 
gesetzt wird, und wenn 


Coe fe 
Sil» S29 ** +) Sn-1 
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; da (x E 
die Nullstellen von — bezeichnen, d.h. diejenigen n—1, notwendiger- 


weise voneinander verschiedenen Abszissen, an welchen das Polynom a(x) 
ein Extremum hat, so lautet die nach steigenden Potenzen von x—x, laufende 
Entwickelung der ganzen rationalen Funktion /,(x)! 


ENG elas \ at 
(5) h(x) = I= 75]5( > es | +4 am a (x—x;.)? + pie 


m1 Xr— Sy, neh (Xi: — Sm 
Da 
n-1 2 
5 1 \~ 
(6) >—| 
ist Xi — Sn 
niemals negativ wird, und da 
nol 
(7) Sr 


Pies (Xx —— cake 


entschieden positiv ist, so liefert die Formel (5) den Beweis dafiir, dab /,.(x) 
an der Stelle x——x, ein ,,wirkliches“ (d.h. isoliertes) Maximum hat.’ 

Zu diesem Satze 1 bemerke ich zundchst, da der entsprechende Satz 
fiir das Lagrangesche ,(x) im allgemeinen nicht giiltig ist. Weiter erwahne 
ich hier, daf zum Beweise von Satz 1 auch ein anderer Weg gangbar ist: 
die s.g. ,Methode der Wurzelabzdhlung* fiihrt ganz kurz zum Ziele. Der 
Grund, weshalb ich doch die auch sonst beachtenswerte Formel (5) an die 
Spitze dieser Note stellte, ist der, daf& in ihr einerseits die Nudllstellen 
iy, Xo,--:,X%n Und. die Fxiremumstellen. &,5,...,6:-1 des Stammpolynoms 
(x) = (x—x,) (x —x,)---(x—x,) figurieren, und andererseits der Umstand, 


1 In der alteren Sprache der Analysten lautet dieses Resultat, da die zur Stelle 
x—x, gehérige Grundfunktion f(x) der Hermiteschen Interpolation in der ,Umgebung“ 
von x; gleich“ 


amt Xk—Sin Ane (X4— Sn) | 


Rd CS ST he ie 
eps as He Aa> tx — xy? 


ist ,bis auf Gréen dritter Ordnung in Bezug auf x—x,“. Vielleicht darf ich noch zusam- 
menfassend hinzufiigen, daf der Wert der Ordinate von y—/y(x) an der Stelle x= x, den 
Wert 1 hat, die Tangente an dieser Stelle x= x;,,y=—-1 der Abszissenaxe parallel lauft, 
und daB die Kriimmung von y=—fh,(x) an dieser Stelle gleich 
( fp n-l Nie n-1 
ee = 1 
sh(SeaT+3 


: a —_ E )2 
6 mal Xk—smn) m—1 (X<— 8m) 


ist. 

2 Ich meine natiirlich, daB fiir h(x) eine zweiseitige Umgebung der Stelle x = x;, exis- 
tiert, in welcher, x, ausgenommen, iiberall (x) < Ay (xi) =1 giiltig ist. Ich setze hier vor- 
aus, da8 mindestens zwei Interpolationsstellen gegeben sind, also HB hows o lorraine 
ist der Satz auch im Falle einer einzigen Interpolationsstelle x, giiltig, da doch dann 
h,(x) =1 ist, aber natiirlich mit der Modifikation, daB das Maximum von h,(x) fiir x =x, 


nicht isoliert ist. 


1* 
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dai die Nichtnegativitét von (6) und die Positivitét von (7) die Wahrheit 
von Satz 1 in so anschaulicher Weise zur Evidenz erheben. 

Endlich wollte ich durch Anfiihrung von Satz 1 in der Einleitung den 
Charakter der elementaren Bemerkungen andeuten, die in dieser Note enthalten 
sind und die sich 4lteren, bekannten anreihen. 

Es ist nicht zu erwarten, daB eine so kurze Note wie diese* auch die 
erforderlichen literarischen Daten des ausgedehnten Gebietes der Interpola- 
tionstheorie enthalte. Doch michte ich erwahnen, dafi SzeG6 zu den ersten 
gehort, dem die Interpolationstheorie (und auch die Theorie der mechanischen 
Quadratur in der hier in Rede stehenden Richtung) bedeutende Fortschritte 
verdankt, die teilweise in seinem Standardwerk Orthogonal Polynomials“ 
(American Mathematical Society Colloquium Publications, Volume XXIll, 
1939) entwickelt sind. 


§ 1. Beweis fiir die Giiltigkeit der Reihenentwickelung 
des Grundpolynoms erster Art /7,(x): 


Tih) ee Pes | ads x, 
: ( ) 5 | m xe —-§,, m=1 (X;, a \ ic Xr) 

1. Es seien 
(1) Xe kg een ae 
voneinander verschiedene reelle Werte (Interpolationsabszissen), und 
(2) «(x)= (X—x) (X—%) «+ (XK—&,) 
das zur Abszissengruppe (1) gehérige ,Stammpolynom*. Dann gilt bekanntlich 
¢ “3 by, x; (x) ’ 
( ) 1( ) a (x) (=n) 
4 me Be AY on, 2 
( ) (xX) | @' (X4) (x Xx) (U,.(x)) : 


Wenn wir nun das Polynom (x) um den Wert x—.x, in Taylorsche Reihe 
entwickeln, so erhalten wir 


“ | a ae - l ” 2 1 tr 
(5) (3) = 0 +0) (Xa) + 0" Hi) (R—¥i) +” (He) (KY Ee, 
und mit Riicksicht auf a und (4) nacheinander 


6 is a (xi) 1 w(x) ; ; 
(6) ii) il chars oO (x—x) +% oe) eet y er. 


* Bei der Drucklegung, resp. bei Anfertigung der Figuren waren mir J. Batdzs, 
Katatin Horvay, M. Miko.ds, F. MounAr behilflich. Es sei mir gestattet fiir ihre Miihe auch 
hier meinen herzlichen Dank auszusprechen. 


BEMERKUNGEN UBER DIE GRUNDPOLYNOME PARABOLISCHER INTERPOLATIONEN 231 


(1) [h(xP—1+ oo" (Xx) (x—xi) 4 k Lo" (Xi) ae (Xx) | | e—209+ ee 


7) (X).) F. (a) "(%) 3 a) "(X:) 
(8) iy, (x) == 1— . (x—x,)? + ee, ‘ 
wo 
aie Ca yO" Oe) 
(9) o te eV o aene 


Zu beweisen habe ich, daf A, positiv ist. Ich werde mehr beweisen, 
indem ich naémlich zeige, dafi die aus dem Stammpolynom (x) entstandene 
gebrochene rationale Funktion von x 


(x) )—4 vay etd). 
om (xX), oy (x) 
tiberhaupt fiir jeden reellen Wert von x einen endlichen positiven Wert besitzt 
und nur an den Nullstellen von w’(x), die wir mit &,,&,...,§ 1 bezeichnen, 
und die mit der Gesamtheit der Extremum-Stellen von (x) identisch sind, 
positiv unendlich wird. Ist namlich x von &,&,..., & 1 verschieden, so ist 


(10) A(x) = 


Gy £8) oo"! 0") _(o" OF 
dx w(x) ('(x)) wy (Xx) 8 (XY Je 
so dab 
w(x) _{ w(x) pain | a(x) . 
) o'(X) Soe } "dx o'(x) 
Jetzt ergibt (10) 
om” (x) 44 oy (X) 
ay AGS Fas 5( 4 0’ (x) Mk ear xe 


Da weiter &,,&,...,&,: die voneinander verschiedenen Wurzeln von 
oy (x) = (x —&,) (x —&.) --- (x —§,-1) bezeichnen, so erhalten wir nacheinander 


oo (x) \ 1 


a WAG) aE: 
HP OAS se geek 
ey dx ow'(x) si (x—,) 
so daB also, mit Riicksicht auf (13), (14), (15), 
w-1 2 n-1 
1 = 1 
=—=5)| > aT eee 
(16) A(x) =5 Beery b4 > ey 
Hiermit ist der Satz 1 der Einleitung bewiesen. 
2. Zur Illustration diene der Spezialfall n—3, x, — —1, x. —0,x,—1.- 
ey ae eae 8 
Jetzt ist w(x) —x°—x, o'(x)—3x—1, & ore E, = 75° (x) = 6x, 
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w(x) 6, so daf also die Formel (10) 


9(m" (x) P—4.0'(x) 0" (x) __ 252 x424 
ee aa txy (3x°—1)° 


UT). A(x) = 
d. h. 


A(x) — 21x 2 
122. (Sx 


.liefert. (S. Figur 1.) 


-i -4 


Figur 1. 


§ 2. Uber die Summe der Grundpolynome zweiter Art 


1. Es seien x,, %.,...,X, wieder voneinander verschiedene reelle Werte, 
die zu einer Hermiteschen Interpolation dienen. Wir haben in der Einleitung 
auf die einfache Tatsache hingewiesen, dafi die Summe der Grundpolynome 
erster Art /,(x)-++-/.(x)+----+-A,(x) identisch gleich 1 ist. Mit der Summe 
der Grundpolynome zweifer Art ,(x) + by(x)-+ ----++,.(x) habe ich mich zum 
erstenmal im §10 meiner Arbeit ,Uber WeierstraBsche Approximation, 
besonders durch Hermitesche Interpolation“ beschaftigt (Mathematische Annalen, 
102 (1930), S. 707—725). Da werden ausschlieflich die s. g. Tschebyscheff- 
schen Abszissen betrachtet, und die dort befindliche Formel (II), die durch 
leichteste Rechnung erhailtlich ist, lautet® 


(1) >} h(x) = O(x) = (cos 6) = 
k=al 
1 1 vw 
gaa n@ cos (n—1) 6 == an (cos 6 -++- cos (2n—1) 8). 


3 Ubrigens enthilt dieser §10, der die Uberschrift tragt: ,Uber die wichtigsten 
Eigenschaften der Grundfunktionen beider Art im Falle Tschebyscheffscher Abszissen“, auf 
' n 
S. 721, u. A. einen nicht mehr so leicht beweisbaren Satz, der sich auf S’ \b,.(x)| bezieht, 
Te ent 


BEMERKUNGEN UBER DIE GRUNDPOLYNOME PARABOLISCHER INTERPOLATIONEN 233 


2. Weiter wird in meiner Arbeit ,Die Abschatzung eines Polynoms in 
einem Intervalle, wenn Schranken fiir seine Werte und ersten Ableitungswerte 
in einzelnen Punkten des Intervalles gegeben sind, und ihre Anwendung auf 
die Konvergenz Hermitescher Interpolationsreihen“ (Mathematische Zeitschrift, 
32 (1930), S. 426—457) mit Hilfe der Formel (1) ein Extremumproblem exakt 
gelost. Auf S. 441 steht naémlich der Satz 4: ,Geniigt eine ganze rationale 
Funktion g(x) von hiéchstens (2n—1)-tem Grade an den Tschebyscheffschen 
muszissen X,,X),..-; X, den Ungleichungen 


(2) &(xx)| =A, |g’()|=B (sa by ered 
dann ist 

B 
(3) 2G) = Ae 


ip - 


Hier ist das Zeichen der Gleichheit (bei gegebenen n, A,B) dann und nur 
dann giiltig, wenn 

snd —1)6 

£(x)=g (cos 0) =A+B oe — ee. 


3) cos 6+- cos (2n—1)6 
ay ey Fm 


ist, oder dasselbe Polynom mit entgegengesetztem Vorzeichen.“ 


3. Endlich méchte ich noch auf eine zweite Stelle derselben Math. 
Zeitschriftarbeit hinweisen, die sich auf Seite 456 befindet, und sich wieder 
nicht auf > 6,(x), die uns jetzt beschaftigt, sondern auf > '|h;,(x)) bezieht. 

ree eS 


Es werden dort unter Nummer (19) und (20) die beiden Satze ausgesprochen, 
da in Tschebyscheffschem Falle 


VL 


(5) > lhu(x)|= > )=1 - (H1<x<+)), 
k=) sak 
(6) eee leek ee). 
. k=1 


4. Vor nicht langer Zeit habe ich die fast triviale Tatsache bemerkt, 
daB die Summe der Grundpolynome zweiter Art, d.h., kurz ausgedriickt, 
(x) ,immer“ voneinander verschiedene reelle Nullstellen besitzt. Ich dart 
vielleicht den Satz formulieren: 


und spadter von verschiedenen Autoren kunstvoll geeignet verallgemeinert wurde, fiir den Fall, 
in welchem die Abszissen nicht mehr die Tschebyscheffschen, sondern allgemeinere, in 
diesem oder jenem Sinne ,normal“ verteilte Abszissen des Interpolationsintervalls (—1, +1) 
sind. Mein Satz lautet: ,Die Summe der absoluten Betrage der Grundpolynome zweiter 


nr 4 
Art 0).(x), d.h. die Summe pa |b,,(x)|, konvergiert im Falle Tschebyscheffscher Abszissen 
k ? Siar al 
k=l Reta. ie : ¥ 
zu Null, wenn n—>~x, u.zw. gleichmaSig im Intervalle —l=x= —- if 
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Satz 2. Sind x,,X),...,X, beliebige voneinander verschiedene reelle Abs- 

zissenwerte, dann sind die Grundpolynome zweiter Art 
hh, (X), He(X),s - => Da(X) 

der Hermiteschen Interpolation durchweg ganze rationale Funktionen von genau 
(2n—1)-tem Grade. Jedes dieser Grundpolynome hat lauter reelle Nullstellen, 
und zwar hat \y.(x) an der Stelle x, eine einfache Nullstelle, wdahrend sie an 
den iibrigen Stellen X,, X2, +. +, Xi-1) Xi, +++) Xn eine doppelte Nullstelle besitzt. 
Die Summe 
b,(X) + bo(x) +--+ + Oa) = BCX) 
aller Grundfunktionen zweiter Art ist ebenfalls eine ganze rationale Funktion 
von genau (2n—1)-tem Grade, die nun ebenfalls lauter, voneinander verschie- 
dene reelle Nullstellen hat. n dieser einfachen Nullstellen liegen in den Inter- 
polationsstellen X,,%2,...,X, selbst, die tibrigen n—1 einfachen Nullstellen 
M1 Nay+++) Nn-1 Oefinden sich (wenn wir etwa X,<X%.<-++< Xp voraussetzen) 
in den Intervallen (x,, Xo), (Xo, Xs), «++, (Xn-1, Xn), SO dap also 


(7) Xi SNCS Xo < ay Xe MS 


5. Der Beweis dieses Satzes laf{t sich auf verschiedenen Wegen leisten. 
Er folgt natiirlich unmittelbar aus der Tatsache, dai, wenn 


(8) Yi.) — 200) 


gesetzt wird, £2(x) an den Stellen x,,x.,...,x,, der Reihe nach, die von 
Null verschiedenen endlichen Werte 


Lee oe 1 
(x) -o’ (%) o' (X;,) 
annimmt,' die ihr Vorzeichen immer 4ndern, wenn man von einer Nullstelle 
x, des Stammpolynoms m({x) zur folgenden x,,; schreitet. 
Ubrigens lat sich dieser Satz auch noch einfacher beweisen. Ist doch 
: : e — : eo a) 5% 3 
= > ho) = F @—) AO) = Dx) P| = 
rl koa o *(x.) (X— Xr). 


(9) 
1 9 (X) 


0) » x.) (x 
(x) > ; Pa ‘(x:) y' (Xi;) (x— X;) 


o(x) 2 s 


Sy hO 


d. h. a > bn (x) ist gleich dem Stammpolynom (x), multipliziert mit dem 
Barents (n—1)-ten Grades, das (mit Riicksicht auf die Lagrangesche Inter- 


' Dies folgt aus der Gleichung (8): 


[S109] | O (X4) 2" (Xx) 4 0" (Xj) 2A) = 1 (x,) 2 (x,). 
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polationsformel) an den Stellen x,,x2,...,x,, der Reihe nach, die Werten- 

folge alternierenden Vorzeichens ————; i ipeiesy Sans 

o'&)) ox)? o) 

Ein dritter, vielleicht einfachster Beweis dieses so naheliegenden Satzes 
lautet: da 


annimmt. 


0G) 30 (<>) == = (X%,) —0, 
8 (4) = 9%) = =) =1, 
so wdchst (x) an ihren (einfachen) Nullstellen x, < x,<-+-.< x, nach vorwdrts 


und nimmt ab nach riickwdrts usw. 


§ 3. Uber die Summe der Grundpolynome zweiter Art. Fortsetzung 


1. Betrachten wir die Differenz 


(1) k(x) =x— > h(x) =x—(x). 
5 | 
Da 39’ (x%,) = 0’ (%»)) =; --== 9'(x,) =1, so gilt fiir die Ableitung k’(x) der gan- 
zen rationalen Funktion (22—1)-ten Grades k(x): 
ke Og) = F Oa) == -- - = K(x,) =0. 


Also ist k(x) eine zu den Stellen x,,x:,...,X, gehdrige, sogenannte 7reppen- 
parabel. Daher liefert die Formel (2) der Einleitung, mit Riicksicht auf 
MAX a Xy, (Xp) — Xo, - «=, K(Xp) — Xn, 


(2) k(x) =x— B(x) = D> xxl), 
jal 


aie ES , 


woraus, mit Riicksicht auf > A(x) 
ee 


forty O(X) == x PEE ROG aks it) = Xelie() — = (x—Xx) A(X) 
k=1 emt | (2 = 


k 


folgt. Wir haben also fiir die Summe der Grundpolynome zweiter Art die 
Formel 


(4) > be(x) = = (exe) eX) 
hl = 


gefunden, die, ich wiederhole es, ftir beliebige Stellen x,,%2,...,X, gililtig ist. 
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§ 4. Uber die Summe der Grundpolynome zweiter Art, 
wenn die Abszissen x,,%,...,x, im Intervalle a=x=8, in welchem 
sie eingeschlossen sind, dort normal verteilt sind 


1. Wenn H’(x) die Ableitung nach der reellen Variabel x einer ganzen 
rationalen Funktion H(x) mit reellen Koeffizienten und von héchstens (2n—1)- 
tem Grade bezeichnet, und diese Ableitung H’(x) an n verschiedenen reellen 
Stellen x,,X»,.--,Xn verschwindet (also H’(x,) = A"(x.)—--:-—H’'(x,)=9), 
so nenne ich die Kurve y—— A(x), oder auch das Polynom H(x) selbst, eine 
Treppenparabel. Ist weiter @= x= 0 irgend ein abgeschlossenes Intervall, 
das die Stellen x,,x.,...,x, ausnahmslos enthalt, wahrend keine einzige der 
Stellen X,,X,,...,X,, die, mit Hilfe der Stammfunktion 


(xX) = (Xx—X) (Xx — Xa) - +: (X—X,) 


und nur mit ihrer Hilfe, durch die Formel 


(1) Xp mae (E=1- 3 een) 
definiert sind, in das Innere des Intervalles a= x= 6 fallt (d.h. ist entweder 
X;>6 oder X,<a (kK=1,2,...,)), dann sage ich, daBh die Stellen 
Xi, Xp, «.3; Xp nr Intervalle: a= x= -b normal vertellr sing? 

Die Formel (2) der Einleitung liefert fiir eine Treppenparabel A(x) 
folgende Darstellung: 


(2) H(x) = H(x,) hy (x) + H (x) f(x) + +++ + A(x) h(x), 


die natiirlich fiir jeden reellen (oder komplexen) Wert von x giiltig ist. 

Da fiir jedes x die Identitat A,(x)+h.(x)+-~+h,(x)=10 giiltig ist 
und fiir a<x< 6. die Ungleichungen h,(x) = 0, h,(x) = 0,..., 2,(x) = O statt- 
finden, so entnimmt man aus der Formel (2) folgenden Satz: 

Wenn die Stellen x,,x,,...,x, des Intervalls a=x=b6 in diesem 
Intervalle normal verteilt sind, so kann eine zu den Stellen x,,%»,..., Xa 
gehérige Treppenparabel H(x) im ganzen Intervalle a = x = 6 keinen griéferen 
bzw. keinen kleineren Wert annehmen als den gréSten der n Werte 


(3) F(x) F710) oe ed 
bzw. den kleinsten dieser 2 Werte. 
(Man sucht also das Maximum und das Minimum der Treppenparabel 


(2n—1)-ten Grades im Kontinuum a= x = 6 und findet diese schon unter 
den n Werten (3).) 


» Ist o”(,) — 0, dh. hat die Stammparabel (x) an der Stelle x,, wo sie die x-Axe 
schneidet, einen Inflexionspunkt, so ist die Forderung (1) fiir x— x, natiirlich ,erfiillt*, Wir 
sagen in diesem Falle, da X;,—— cc. 
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2. Wir wollen nun wieder die Summe der Grundpolynome (x) — 


VD 


—> b.(x) betrachten, diesmal aber die Stellen x, der Beschrankung unter- 
ad 


werfen, da sie sdmtlich in ein Intervall a=x=b fallen, in welchem sie 
normal verteilt sind. 
Betrachten wir das Polynom 

(4) GO)—x. 
Wir kénnen etwa a=-—1, 61 annehmen. Dieses Polynom nimmt, nach 
der Definition von (x), an den Stellen x,,x,,...,X,, der Reihe nach, die 
Werte —x,,—X,,..., —X, an, und ihre Ableitung ist.an denselben Stellen 
gleich 0. Also ist S(x)—x ein Treppenpolynom, die zu einer Abszissengruppe 
X,,%,..., xX, gehort, die im Intervalle —1 =x =-++-1 normal verteilt ist. Das 
soeben erwdhnte allgemeine Lemma iiber die Treppenpolynome liefert also in 
diesem speziellen Falle: 

Min {—x,}= .- Min 
y= Series =sbiy 20 ISS 4 


also 


{H(x)—x}= Max {H(x)—x!}= Max {—x,}, 
1 7S + sey) cals 


iE 


—1 = $(x)—x=1, 
und endlich 


somit den 


Figur 2. 


Satz 3. Wenn X1,Xo,--+) Xn im Intervalle —l=x =1 normal verteilt 
sind, so ist fiir die Summe der Grundpolynome zweiter Art: 
(5) x—1=h() thQO+-:: +h.() Sx+1 


im ganzen Intervalle —1=x= +1 giiltig. 


a3 L. FEJER 
Aus (5) folgt natiirlich 
(6) Dix)|=2 fir —lsxs+l. 
= 


Diese Ungleichung ist fiir jede normale Interpolationsgruppe und fiir 
jeden Wert von n (n=-1,2,3,...) giiltig. Sie 1aB8t sich nicht verbessern, wie 
das folgende Beispiel zeigt. Es sei a—=—1, = +1, n=——1, und die einzige 
Interpolationsstelle, die ich mit x, bezeichne, mége in —1 liegen, d. h- 
x,=-—1. Da jetzt 4,(x)—1, §,(x) =x +1, so kann ich also in diesem Falle 
behaupten, dai einerseits x,—-—1 eine normale Verteilung reprasentiert, 
daB andererseits |§,(1)| = 6,11) =1+1=—2. (S. Figur 2.) 


§ 5. Einige Formeln fiir die Grundpolynome, tabellarisch 
zusammengestellt 


In diesem Paragraphen méchte ich einige, auf die Grundpolynome der 
Lagrangeschen und Hermiteschen Interpolation beziiglichen Formeln tabellarisch 
zusammenstellen. Nicht von allen Formeln habe ich in dieser Note Gebrauch 
gemacht, andererseits fehlen einige, die im Texte zur Anwendung kamen. 
Dem Gegenstande etwas ferner stehenden kann sie vielleicht doch niitzlich sein. 


Tabelle 1 
0 Bee Ped 3 
) (X) = (x —X,)(x— x.) ---(x—x,,) 
: (x) 
(2) be Ty (xa) (ae 
(3) M(x) = (12 I. (xx) (X— xr) (A)? 
(4) In (X) = (x—x:) (h(x) 
Tabelle 2 
(3’ ins) — [1-2 x) (hax) 


@) h(x) (xxi) ()Y 
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Tabelle 3 


GQ") o(x)=0+0'(x.)(x—x,) + ; on" (%,) (x— xi)? $5 oo" (Gx) oe 


qo” ia yh. oO (X) ba {X,.) ee 
(2 ) L(x )= 1+ 2 «o’' (X,) (x— Xie 6 (x) (x —=— Xj.) ses 
, om’ (Xx) | wo (%) , 1 fw") \ ie 
2’) (Lh, —=1 > {x non Nie ale 
BEC + oy C—O +13 Seen ta |S |@ 0 
25) f(x) =1-+0 oe CEN ee 
wo 
, ees oy” (X;) 
A,—9| 2 ey Ae. 
Bezeichnen 
ike, phe at En 1 
die Nullstellen von a , so ist auch 
Se oy gee eS a | 
4g ) BS ile ps Xk =e, +4 aoe hte a) 
giiltig. 


(Eingegangen am 1. Juli 1955.) 


HECKOJIbKO 9JIEMEHTAPHbIX 3AMEYAHMM O @YHJAMEHTA JIbHbIX 
MHOPo4U JEHAX MAPABOJIAYECKOTO MVHTEPMOJI“POBAHHA 


Jl. Penep (Byjaneut) 


(Pe3t10me) 


B wacrosen crarbe COOOMaOTCA HEKOTOPble aHHble O MOBeAeHHH (PyHsaMeHTAMbHBIX 
MHOTOUNeHOR AarpawKena u 3pMuTOBa MHTepnoAMpoBaHns. B BReg_ennn 1B NepREIX Tpex 
naparpatbax aOcUUCChI MHTEPNOAMPOBAHHA X,, Xy,-.+, X, CHNTAIOTCA NPOUSBOABHKIMH, B YeTBEp- 
TOM sae — HOPMA@JIbHbIMH OTHOCHTEbHO negonspere oTpeska (a,b) (@= xy <x 
<:--- <x, <b). B natom naparpae npusepena tabmmua tbopmya. U3 pesyabraror ynomuna- 
IOTCA 3f€Cb IMWb TPH. 
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UV 


1. Econ fy(x) o603HayaeT KakON-HHOyAb (pyH{aMeHTaJbHbIM = MHOrOYeH MepBOre 
nopagka 9pMuTOBAa UHTepnoAMpoBaHnA, TO passoxeHNe sTOrO MHOrOWIeHa CTeneHm He 
Bpe 22—1 mo creneHam X—X;, HAYMHACTCA Tak : 


i! xX, i < 
hy. (x) 1— pro (x—X;) (L, (x) ye a 
n-1 2 n=l 
1 <i > 1 z ‘ye 
ie 2: . bs ral v 1 Xi — $7)? sae: 


THE Xy,Xo,..+,) X» CYTb HE COBMafatouNe Apyr C ApyromM, BeuLecTBeHHHIe, a BO BCeEM OCTAAb- 
HOM NPOHSBOJIbHbIE Y3IbI HHTEPNOMMPOBAHHUA, © (xX) —= (X—X,)(X—Xs) --- (X—X,) u §,,5,..--,§, 
— KOpHH ypapHeHua ow’ (x)—O0. Orcroga cnepyer, YTO (pyHAaMeHTAAbHBIM MHOrOWIeH NepBoro 
nopagka h,(x) umeer AOKanbHbIi MaKCHMyM RB TOUKe X= X;,, B KOTOPO OH PaBeH eAMBMe 
aa eer): 

2. Uspecruo, 4To byHAaMeHTaAbHbIe MHOFOWIeHbI BTOPOrO NOpsAAKAa SPMUTORA HHTep- 


nomuporannsa fh, (x), Yo(X),---, b,(xX) paBHbI HymIO BO BCeX y3aaxX HHTepnoANpoRaHHA 
X1, Xg,..-, Xn. CmeqoBpaTembHO, TaM uCcyesaeT HU UX CYMMAa 
hy (x) + ho(x) +--+ + b,(x) = (2). 


B cratbe OTMeyaeTCA TOT (PakT, 4YTO BCe KOPHU |BTOrTO MHOrOUTeHa (B TOUHOCTH) 2n—1-ol 
cTemeHu — BelIeCTBEHHBI. 

3. Ecam 8 1 u 2 peub wiia O MOObIX MPOCTHIX BeUECTBEHHBIX AOCNCCaX, TO NYCTb 
Tenepb —l= xX; << xX, < +++ CX, <1 u nycrb 9tTu aOCUNCCHI HOPMANbHO pacnpepAemsOTCH Ha 
orpeske —1=<x<= 1. Torga na 9TOM OTpeske BHINOMHeTCH HeEPaReHCTBO 

x—1=]$Q)2x%41 
M, CeAOBaTebHO, 
|(x){ = 2 (—1 sx). 
B aTOM HepabeHctBe 2 He MOXKET ObITh 3AMCHEHO MEHBUINM YHCHOM, CCAM MbI He XOTHM, 
YUEMIIATh OOWLHOCTH. 


ON SOME NEW THEOREMS IN THE THEORY 
OF DIOPHANTINE APPROXIMATIONS 


By 
VERA T. SOS (Budapest) and P. TURAN (Budapest), member of the Academy 


1. In a recent book' one of us based a series of applications on the 
following three theorems. 


iit 


pif Na es zal 
m is a non-negative integer, the 6,’s are arbitrary complex numbers, there is 
then an integer 7, such. that 


m+la=y,=m-+n 
and 
by 2% + bozht tess + b,27) = zal” cfg | | : 
[121° + b223' 4 + Dn Zn'| = |2n| Ea -+06,|. 
If. With the above notations there is an integer 7, such that 
m+1=%y,=m-+n 
and 


Lm at n 
1) » a2 ras ease) ae Je 2) = v2 rs — 
[21° + b2z2" 4 On 2n'| = [2] | 24e*(m +-2n) 


II. With the above notations and 


o@)— 11 @—2) 


there is an integer 1, such that 
m+1=s=7=m-+4n 


[b121? + be23° + +++ + Oz | = 


min |0,-+---+0);|. 
j Meneses tt 


and 


=(Sionai") Urea Pivetiey |e! 


ee Pres may | wo’ (z)|( + |27]) 
In mentioned book’ it was discussed mainly as a matter of orientation and 
had only one application in the investigation of integral functions of type 


— 


» % F(c,2) 


a 


1 P, Turdn, Eine neue Methode in der Analysis und deren Anwendungen (Budapest, 
1953), Akadémiai Kiado. 
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where F(z) is an integral function. Since that time the second of us found 
some more applications of it. To show the essence of these three Theorems 
I, Wf, WY we call the quantities 


Ve 


iat) a lollegl, (en 


j=l 


t: > 


) [21] 


Ni(v,f) norms of f(”) = » bz) (= 1, 2, 3). Then the Theorems I, Hand Hl 
waa . 


> b;2z7| is esti- 
y=! 


can be expressed by saying that, for a suitable integer v, 


mated from below by the N,(v, f) norms (1.1) so, that the lower estimation 
of their quotient should be independent 


a) of the z;-values 
(esc) eon 
b) of the 0; coefficients. 


Theorems I and II are of a)-type, Theorem III is of b)-type. This formula- 
tion of the theory is more symmetrical than that given in ', where only pro- 
blems of a)-type were systematically treated. In connection with an applica- 
tion® the necessity of dual theorems emerged where non-trivial upper esti- 
mations of 


| f(y) 
min aC 
m+1Sv=m+n Ni(7,f) 
1 integer 


are needed even at the rate of simple geometrical restrictions on the z;’s. In ' 
one can find detailed motivation, on which way Theorems I, If and III can 
be considered as generalisations of KRONECKER’s and DIRICHLET’s classical 
theorems in the theory of diophantine approximations. 


2. In' the emphasis was laid upon the applicability of these theorems 
and no care was taken to best-possible inequalities, though these have a 
significance for some applications, too. One can show this e. g. on the esti- 
mation” of N(«, 7), the number of zeros of 5(s) (s— o-- if) in the parallelo- 
anioa«¢,O<t= 7 


(2. 1) N@;T)=O7 es ). 
which is uniformly valid for 
(2. 2) l—d =¢=]1 


with a (small) numerical positive 0. This constitutes the best-known estima- 


> P. TurAn, On Lindeléf’s conjecture, Acta Math. Acad. Sci. Hung., 5 (1954), pp, 
145—163. 


* This is an unpublished sharpening of Theorem XXXVII of 1. 
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tion in this range today. The proof of this is largely based on the case 
(2. 3) Oi 0p == = 0, == | 
of Theorem II; thereby the decrease of the numerical factor 24e, since n is 


“large in this case, would result an increase of 0 in (2.2) which in turn 
would result a decrease of the smallest known © with the property 


Dn +1 == Di are O(p’) 
where p, denotes the nt’ prime. The main aim of this paper is to review 
the a)-type results in the first part of’ from this point of view, in particular 


in the case (2.3), and to study certain (21, 22, +--+, Zn)-Systems, which will 
play a role in these questions. We suppose without loss of generality 

(2. 4) ne ae [2-21 (j= tT) 

in I and 

(2. 5) Pete hey eel (Jel eet) 


in II. In the case (2.5) we ask for the ’smallest“ numerical positive value 
A,, for which 


(2. 6) max jet pah peo 2h] =| 
m+lsv=m+n ‘ 
y integer 


lee 

_A,(m +n) 

holds for an arbitrary non-negative integer m and positive integer n. We 
shall show in 6—9 the following 


THEOREM. We have for the A, defined in (2.6) the inequality 


4 
Lote A, 2c * (= 24): 


The gap is still large but the upper bound is much better than the 
previous 24e?~ 177. That A, > 1,1, can already be shown taking 


m=0, n=2, 2—1, ose? 
in this case we have 
atalaie, |zi+25| 18 
a. 
US eo Aeceeee |) 
| /13 


An interesting feature of the proof of the upper bound is the avoiding of the 
use of H. CarTAN’s theorem and replacing it by a lemma of CHEBYSEv-type. 
The new proof furnishes mutatis mutandis the following improvement of II. 


2 Acta Mathematica VI;'3—4 
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Under the conditions of II we have 


ya | - min |b,+---+6)|. 
1+ bi Leena et 
2e ‘“(m+n) 

It will be sufficient to indicate only the changes, the proof of (2.7) 
needs compared to that of the theorem. 

3. A further refinement of the upper estimation in the Theorem would 
be given if the constant 2e in I could be diminished, even only in the special 
case b,—=---—=6,—1. Asking for the ”smallest“ numerical positive value 
As, for which in the case (2. 4) 


(2; 7) toga +. + b,, 2a > IZ, (" 


4 


- 4: ( Nn \ me 
(3. 1) max |Z; 25+ --- +2; =|- | 
Seen : 8 . a x ‘7 : A;(m-+n) J 
v integer 


holds for any positive integer n and non-negative integer m, nothing better 
than 

(3. 2) 1= A, = 2e 

can be asserted at the present. Something better can be said on the ’’smallest*‘ 
numerical positive value A, for which in the case (2. 4) 

(3. 3) max |b,z1-+++-+d.2z| = 


m+lSvE=m+n ti | A;(m-+ n) | Jo. 


y integer 


+ 6, 


holds for any complex 6,’s, positive integer n and non-negative integer m. 
We shall show in 10 that 


(3. 4) 127 z < A, <2e~5, 44. 


4. The lower limitation of A; in the Theorem will be proved in 9 by 
refining an idea of P. Erpos, i.e. considering (z,, 2, ..., 2,)-systems with 
the property 


(4. 1) Sp = Sy SH. = 0, 21 
where s, stands for z;-+-25-+----+-z/. This suggests for the sake of counter 
examples the usefulness of the study of all (z,,...,2,)-systems with the 
property 

So = Ss = ee Sn—l = = Sy — 0, 


or more generally with a prescribed non-negative integer m the determination 
of all those with 


(4. 2) Smit Sm42 == +++ == Sn +n-1 == 0. 


We mention another reason why (4. 2) is interesting. The whole theory emerged 
from the necessity to diminish the interval for v; in I, IT and HI as much as 
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possible; the question arises now, whether or not for some integer values m 
there is a non-trivial lower limitation for 


Sy) 
max a 
m+) Ser Sm4n r|2,|" 
y integer j 
or tor 
|s.| 
max jones 
Wit 1 eS mn rm I Zul’ 
v integer 


That such a reduction of the interval for » is generally impossible, is trivial, 
since in the case m==0 mod n we have for the nt" roots of unity 


Sm = Sm42 = -°°° = Smin-1 = O. 


Probably the same holds for a// non-negative integer values m. As the Newton— 
Girard formulae show at once, for m—0 all the (z,,..., 2,)-systems with 


(4. 3) f= Sp = = 5, = 0 
are given by the zeros of an equation 
(4. 4) z+a=0 (a arbitrary complex). 
‘We can determine all systems satisfying (4.2) with m—1 and m= 2. 
For m==1 we assert that all (z,, 2%, ..., Z,)-systems with the property 
(4. 5) Sos Soe - Ss = '() 


are formed bythe zeros of an equation 


(4. 6) (2, 2) == 2" + nF gv toe... 4+ — = 0 (a arbitrary complex). 


An asymptotical determination of these systems for fixed @ and now 
follows at once from SZzEGO’s‘* results. For m= 2 we shall see in 11 that 
all the (2, 2, .--, Zn)-systems with 


(4. 7) Ss = Sg = 0+ == Sn = Sn41 = 0 
are formed by the zeros of an equation 
H(A LAL: 
(4. 8) Sr(Z, a, 4) = 2" fee age em no a" —0, 


where H,(y) stands for the 1" Hermite polynomial defined by 
eg eae 
H,{y) = (—1) ev dy” “ : ’ 


i. denotes any zero of Hys(y)—90 and a is an arbitrary complex number. 
An asymptotical determination of the zeros of f,(z, a, 4) is not known. The 


4G. Szec6, Uber eine Eigenschaft der Exponentialreihe, Sitzungsber. der Berl. Math. 
Ges., 23 (1924), pp. 50—63. 


OF 


246 VERA T. SOS AND P. TURAN 


result (4.5)—(4.6) can be easily’ proved by Newton—Girard formulae so 
we omit the details. It is interesting to remark a characteristic difference 
between the cases m1 and m= 2. All solutions of (4.5) can be derived 
from the single equation 


ie Saito +7, =0 7 


all solutions of be uy however, can be derived from the (n-+- 1) equations 
A, Gh 


yay! 


z”==0. where . Hua(4)=0. 


5. Owing to the applicability to the approximative solution of algebraic 
equations it is of interest to study II in the special case 


(521) m= 0, b= p= ae = bee 1 
In this case we have to determine 


(Deo) M,= min max |1+22+---+2)]. 
Nee Ss == 1, seam 


In' we have shown 


log2 
(5. 3) M,=—~—~8 an 
foo mh 
according to a written communication of DE BRUIJN this can be replaced by 
(5. 4) M,, > ee (c numerical positive constant), 


what is for large n somewhat better. This makes still more probable the con- 
jecture that M, = d, independently of n. As to the upper estimation of M,, 


Mr. HyYLTEN-CAVALLIUS showed M, = _ ~0,86 and found by con- 
sidering 2) —0,1295 +- 70,7063, z,——0,5128-+-i7 0,1508 the estimation 
M; < 0,831. 


6. Before turning to the proof of the Theorem we need the following 
simple 


LEMMA. Let be O=0=1 and 


(6. 1) (Qo e TT We Z—2y). 
v 
» Another very elegant verification is due to E. Ecervary. Using Euler's formulae 
— 25 sae 
= ah CR Giee=(() a1 eee n—2) valid for any polynomial (z) with simple z-zeros of 
FEF od Cc) 


f , o\—-1 
degree n and using ¢/ (z,, a) (n!z;) a"*' the result follows at once. 
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Then, there is a circle \z|—r, with O0=r,=1 such that on the whole 
periphery 


ld) 
ey 2 (452). 
For the proof we introduce 
(6. 2) P= LT @—|2y)). 
Owing to the classical theorem of CHEBYSEV there is a& with 0 =&=1 and 
aes : {== ie Wu 
(6.3) IP @l=2|Z°]. 
But on the circle |z|—& we have 
ee 2) = ||2 |—|z;||= 5 —|z;| | (j=, 2yr..., A), 


i.e. multiplying, further using (6.2) and (6.3) we get 


oo ae een 
lf(2)| 2 IF @|=2| q ] : 
Hence the above & can be chosen as r,. Q.e. d. 


7. Next we turn to the proof of our Theorem. We may suppose that 
fee 2. Let be, with our numbers 2;, 


(7.1) o(@)= [I e—2) 


1 
and let 0 be a positive number 0 =d =1 to be determined later. To this 
@(z) and 0 there is, according to the Lemma, an r, with 0=7r,=1 and 
such that for |z| =r 


—o 
(7.2) joe = 2(159Y. 
Since each factor |z—z;| is at most 2, we have from (7.2) for |z|— 1 and 
for any choice of the indices (IS) i, << ---<h Sn (ISk=N) 
k | hoes, n 1 " eer n , 
(7. 3) Tf \2—2,\22(3 sa 2( 5] 2 


We investigate two cases. 
Case a) All z;'s are absolutely 27). Then, owing to I, there is an 
integer 7, with m-4-1 = 7, = m--n and 


x tt 


(7 4) leit zt cae To ibs see =o | 
gots ACD _2e(m-+-n) 


Case 6) There is an index / with 1 =/<n and 
(7.5) 1=|2,| = [zo] So = lal > > lal > = feb 
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In the treatment of this case we shall suppose first that the 2;’s are all 
different. 


8. Let first be 
(8. 1) f= IL @—-2) = > » fl) gti ee 


We have obviously 


(8. 2) ie] — | Sy 24] 2 _(* n—t) 


er oe seca 
Next let f@) be that polynomial of degree ZA ESAN which assumes for 
Liat, cose ei, (aCe Values 
1 1 esis Blin ae 
aA) a Ale) a Ala) ’ 
respectively. If 71, then 


=— — =ch’; 
h@= er c 


if 1 </<n, then we can represent f(z) as Newton-interpolatorical polynomial 


fi) =a + cP'(z—z,) + 8 (z—z,) (2-2) + 2 + (22, X2—2)- “(2 — aia 


: : 1 | Tee 
Since the function Pa) is regular for |z >r, and vanishes for z= x, 
x 1 
we have according to NORLUND’s representation 
2 l ; dw 
(8.3) = = | a reaeecalee 
2ott wt fi (w) (W— 2) (W— 2) +++ (W—Zj+1) 


(=0n 1. 


But f,(w)(w—z) «+> (w—zji1) is of type (7.3) with k—n—/+j+-1 and 
thus owing to (7. 3) we have for |w|—r, 


1—0)" pyri ‘1—d\" 1 
| iw) (W—2z,) (W—Z) +++ (W—Zj41)} 2 2 {a dt ? hie — meer 
i.e. from (8. 3) 


2 1 
8.4 2) (_" meds | Ms =e: 
( ) |¢; te on ee) 2 = ” la: 
But we need also f(z) in the form 
~ : 
f(z) Xe 2! 
and we have to estimate the seen c)”. We -have 


(8) @) 
Craver 
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_and if />1, for j—0,1,..., (2) 


(3) _ {2) (2) a (2) + 
G —s = —GH “5 ; Zr, — Cj+2 > Oh Zr,— er oh 
1S7,SjH1 i=r,< 1g SJj+2 5; 
’ 1-j-1 (2) =. 
+(—1) Ci-3 ; >, Pigiryt** rea 45 
lS27,< fe «.,« 74a! 3 J 


cP) = |e) + | Pit) + ical?) + -. 2 Sobe Ply Es 
pia 


Thus from i 4) 


are a) PTS +97 )S+~-+(S) zal 
i1= Se lie) PN ac eos We. Jete-4 I-1—j} 5-71 ( * 
i-j-1 d 1] 
8.5 _2 core es sls Ke 
ee 7 oe ral 3 e x d } yi 
yas I » i 1 
(a) Scr (7 )S-2 (4) 
Let finally be 
(8.6) LAQ=2""4;.@QL= > = ea 
It follows from the definition of f,(z) and Le) that 
8.7) f()=—L@)=—--=—f@=—1, fi@u)=-- =f(@.)=0 


Replacing z in (8.6) by z; and® summing for j=-1,2,...,n we get, 
using (8.7) and writing 
(8. 8) Se a, a A nt 12, 


the identity 


mrn man 


> cy | = > &s,=1, 


va—m-+t y=m+1 
“antes 
mn 
—_— ; (4) 
(8. 9) /= max s|( > If i} 
m+l Srv =m j=m+1 
y integer 


But from (8.6) we have 


4 wi (1) (3) 
fe ie aay 22 G; G. ; 


n -1-jptjo—j-m-1 
Wah 


oo idis(S1ei)( ie?) 


6 Jf we want to prove (2.7) instead of the upper estimation of the Theorem, we 
have also to multiply by 5; and then to sum for /. 
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thus, using (8.2) and (8.5), we get 


m+n ah Ql a 4 \n 8 n 
Ss (4) ze n “7 Ry. | es: =(-$ i 
— Cj | = 2 | 20” 


j=m+1 ae 1—d. 
Then we have from (8. 9) 
8. 10 =2 20" | i 
; Max Sy) "2 ———]. 
( ) epee ee . ~ 
y integer 
Now we choose 0 so, that 
nin ; ie 2 owe 1—o ), 
aa. +n) 
13.) 
1 . 
6= wae =O; 
1+ — 
em-t-n 
then from (7.4) and (8.10) we got 
Vv (al m+n nN 
max za+2+---+2z)| = 205 a : 
y—m+1, +2, ..., ae, at; \ 2e(m-+-n) / 
But 
, \ mee n 4n 
4n Se Hides -— 
] + -——— e° if. C8 Og ces Cat 
8 e(m-+-n) | : 
whence 
oe. es n 3 
max [2i-sss +2n| = 2 oper 
y—m+1, mM+2, ..., m+n i 
2e °(m-+-n). 


i. e. our Theorem is for different z,;’s proved. We can get rid of the restric- 
tion 2.=— 2, (w=) exactly on the same way as in the previous proof in‘ 
and we do not detail it. 


9. Now we turn to the lower estimation in the Theorem. Let % be a 
positive constant, less than 1 and to be determined later, let z,—1 and 
Zo, Z,+++,%, be determined by the conditions (with the notation (8.'8)) 


(9. 1) S; gd n, So same Ss ——— i Sy) = O. 


It is well known that these conditions determine uniquely the numbers 
2; (J =2, 3,.:., 2); let-us denote them by ¢, (€:-e 1,79 ==2,370 ees 
further be 

F(Z) =a" +a,z"3+---+an 


the polynomial with the zeros ¢, (v—1,...,n). Then the Newton—Girard 
formulae give cae 
n-1 


Si 


ss n— 
(9.2) = —Si, 2 = 57, Os = — Fy, «+ +) Qn —=(—1) “Gat 


3p 3! 
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Since ¢,—1 is a zero of f(z), we have 


2 n-1 
a, —()-La oO ys a a | PRAT ALTO Ge et n-1 Sy : 
(l-+a,+ Qy-1) Mesa ba acy ACA ea ya 
(9. 3) ce “4 
apie iS J j 
= ae ee l Ty anile 
| =| ) J! 
Further, we have from Newton—Girard formulae 
asia tren S a(S a 
(9. 4) os yr ary i 
=nles— > noe 1)’ Sr si =. S Sent 


and from (9.3) and (9. 4) 


Sngt = — Sy — nS, = S,(Sn—Gn) = 
(9. 5) 
= S$ 


(n+ ew 4-1" 5 ata & aysit 


; 

Since 0< %< 1, the terms 7 decrease monotonically if / =n, it follows 
he 

(nse pe 


yey" s 


j=ntl 


i.e. from (9.4) and (9. 5) 


(9n)" 7 (aa 4, 
n! n! : 


ae 
omy ) |Snzi1] = Fn Nn 1)e"*" + 


[Sel =n 
k k 
Since k! > & e, we get for n> 10 


em 4 = (ea) f [Sus| = (A+ 1)(€"" +4 9)’) 


\Sa| Sa 


whence with m= 1 
max _|s,|<4(n +1) {e°" + (e9)"}. 


ml Sv=m+n 


If % is the (only) positive zero « of the transcendental equation 


(9. 6) Ks eves, 
then we have 0,2784 = % = 0,2785 and for our ¢,’s 
(9.7) tax |s,| = 8(a+1)e™”. 
eit 


It may occur that (2.5) is not fulfilled by the ¢,-system, i. e. some of them 
are absolutely =1. If so, we can construct simply by contraction a ¢,-system 
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satisfying (2.5) and for which (9.7) holds a fortiori. Thus for an arbitrary 


small «>0O and for n> 1)(#) there is a ,-system satisfying (2.5) such that 
max |S»! <= e-@-O, 
2Sy=n+1 


y integer 
Hence, if for each integer n = 1 and m=O the estimation (2. 6) is valid, then 


apt) ie, > e% ~ 1,321, 
(24> = el izes Avec 2 
indeed. 
10. We are going to prove (3.4). Obviously we need only to show 
A; = es 
iT 


We choose e. g. n big odd, m= n* and with a slight modification of idea 
of P. STEIN‘ 
= — (3) 2-1) 1 ee sbi My St 
=—— petm ry ew > (m+n) = 
(102) 2 e 0; pet (pg é (jf ==) 2 eee 
Then we get 
: 1 n—l _j-n-1)(y+™ ) 
— 2(mn) 
h(y)= yo, j2j = 9! 1 am ef 1 


Eis Foray AG 5) + e acy » ‘| 


=—Cos 


ve 
Let us observe that for all sufficiently ee n’s 


2m - n) [9 =) It 


Sp Pah ere, IC 
4 == COS’ cos" > cos*-! ——_ > ———— 
Ia ‘ re ry ata yb 4n 1 


Hence for m = y= m-+-n we obtain 
cy ] he 
OV s(1+4] Sosin-g eB EN boy 
ol S(1-+- puller carernye Watd| bre yc baat 
ie +- 4G + (3 4 ae salt Do, 


—(m-|- n) 


Since for an arbitrary small ¢>0 we have for n> 1n,(s) 


Ly 74 1 
ft aye “4 wet ale (ieee 


we got 


‘A : 
A, = 1 (1 —8&). Bs Cz d. 


* See J. E. Livrtewoop, Math. Notes (12), An inequality for a sum of cosines, Journ. 
of London Math. Soc., 12 (1937), pp. 217—222. 
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11. In order to show (4. 7)—(4. 8) we take 
adel) S;=—2u, Sy==22" (ez 0): 


Then Newton—Girard’s formulae give 


20, =. — Sy — 0,5, = — 2° + 42’ = }a(4] —at =r : 


denoting by H,(y) the 7" Hermite polynomial defined in (4.9). Suppose we 
showed already 


(11. 2) | a {=} (m=31,2, 6 


for a k<n. Then 
(K+ 1) ais = (Sit + QS; ++ + Qi:$1) 


and, using (4.7) and (11. 2), 


pt 


Oa: tee | 
(k+- 1) i441 — —(Q,-1S2 = M:S1) —= . c= a lest [= 2 = ay Fi, [4 jaw = 


(11.3) a OE Se : | ps r| : ie 


But as well known 
(11. 4) 2x H),(x)—2k Hi. (x) = Ais (X), 
gee. irom (11.3) 


yk H il | 
O41 — (Zant K+ a, ) 
what shows that (11. oe is true for m—1,2,...,. Conversely these values a, 
mssure that s3—= si:=--:=s,=0. For Says we ie 


Sn41 = —(a1S, + apt + @,S1) ==558 (Q,,-1S2 +. @,,S1), 
i. e. from (11.1) and (11. 2) 


grt ul | un f Ul ; 
i Set =— 2 ae Ay 2 
St (Ene iS aA tl Or, 


Sen, i. u H,| a 2nHy s(“|l, 
n! haath Lv Lo fi 


or from (11. 4) 
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Since 7=+0, S,41——O implies u=Av where 
Aid) =. 


This proves already (4. 7)—(4. 8). 
For the value s,.2 we have in our case 


Sit — —(Q,Sn41 + avs, + ce + an S2)= 
es 


(11.5) 


n+2 


pe | 
max  _|S»|==—|v| "| H,(4)]- 
4 nt 


+, (n+2) 


v=3 
If the minimal absolute value of the zeros of 
(4) 


— 
a) 


(11. 6) z*=0 


y! 


is denoted by A,(4), then the maximal one of 


~~ H,,(4) yr zr 
ey v! 
is ay . Hence, if we choose +—A,(A), we obtained a (zi, 
n v 
with 
max j2;|—=1 
aS 
and 
(187) ~ max = ([2i”-++ +++ + 2n”|=— | Aa(4)[An(4) 
v3, 4 003, (+2) nN! 


yt? 
“— gSt = —— Bos 
n!} 


H(A), 


. ++, Z,)-system 


An asymptotical determination of A,(4) (or even a good upper estimation of 
it) and a suitable choice of 2 would probably result a better lower bound 


for A, in the Theorem. 


(Received 29 January 1955) 


O HEKOTOPbIX HOBbIX TEOPEMAX TEOPHM JMO®AHTOBbIX MPHBJIVZKEHHH 


Bepa T. Wlom u Tl. Typan (Byganemr) 


(Pe sw me) 


Bropon us apropon wacroumel paSorbl BO CBO HeAaBHO KEIWeAWe KHUTe jaa 
Web pA, NpuMenennit ANOdanToBHIxX Hepawencrs I, Il, Ill, orHOcAMUXCA K PasAHYHDIM 
BETBbAM aHaIN3a M AHANMTHYECKOM TeOpuM 4ncen. Yayuuenve 9TUX HepaBeHCTB BaKHO HC 
TOYKM SpeHHs NpuMenenni. B Hacroaujen pabote aBTropbl 3HayHTeAbHO yAyuWawT TeOpemy 
Il. B OAHOM M3 CaMbIX BaKHDIX [WIA NPUMeHeHHH CayyaeR aTO yAyumMeHNe COCTONT B Caeny- 


rouyem : Tycrb 
j 


max |Z;|— 1, nu nycTb A OsHayaeT HaMMeHbUIyIO “NCIOBYIO MOCTOAHHYH, 
Da, ae 
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HAA KOTOpOK 
n \ tt 
max |s,|= max Iz, teee t27|=> Freamen 
mt) Sy=m4n 4 m+l =v =m+n t i | A(m si n): 


(v TIPHHUMAeT WeTbIe SHAYeHHS), Mpa BCX LWEbIX HEOTPUUATeIbHbIX 2 M WeAbIX 7. Torna 


4 
[eS 


Loz Ae Ne 


B cexasu C yAyuWeHNeM OL€HKH CHH3y BOSHHKaeT BONpPOC O BCex cHcTeMaX (2, ..., Z,), 
AA KOTOPbIX 


aN Ss = Sk s,—=9, 
Se a hy i 40. 


i oe 
(z,,-.., Z,), YAOBNeTBOPHAOULad yCMOBMIO a) COCTOHT U8 KOpHeM ypaBHeHnst a ea (), 

v=0 
Heckoabko TpyaqHee AOKasaTb, UTO — ONATh C TOUHOCTbIO JO pacTHKeHHA U BpauleHus — 
Bce CHCTeMbI (2Z,,..-,2,), YaOBMeTBOpmtouMe ycnoBNIO b) cocTrouT us KopHen 1-1 
ypapHeunit 


| So Hel) 
— vl 
UA) 


= I= io 0, 


rae H,,(y) ectb mHorowien Opmura crenenn », a 2 m0G0N KOpeHb ypaBHenusl 77, (V) 0. 


print ig se ot a te 


“os ag Se, LNT ag 


is Se nck ola it! 
“py ad . ; 4? oe ie ie 
f - ee “~< and 
p sai one 
: ye" ae ee 
s ‘ 


ON THE INSTABILITY OF SYSTEMS OF DIFFERENTIAL 
EQUATIONS 


By 
P. TURAN (Budapest), member of the Academy 


1. We consider systems of differential equations in the normalform 


(1. 1) OO) Sas Xi + Wp (Xie mae) (vy =1,2,...,n) 
where the a,;’s are complex numbers and 

oD) w,(0,..., 0, f)==0 (ile it 

This means that 

(1. 3) X,(t)=0 (ae alt) 


is a solution of (1.1). The stability theory of the system (1.1) asks what 
can be said on a solution for f>0, when the |X,(0)| numbers are small. 
Among the many questions of this theory we consider here the question of 
the complete instability. For the system (1.1) the solution (1.3) is called by 
PERRON' completely instable, when there is a c >0O such that for each solu- 


tion of (1.1) with 
Ga 1X, (0) Pe <c 
v=l1 


either the solution ceases to exist for a f,>0O or for a ¢t, >0 


2 


= C. 


>, |X,(t) 
7S 


holds. He proved that if for some a and A the functions w,(j;,..., Yn, 0) 
are continuous for 

(1. 4) pee OS Vis Oo | Verce a 

with complex variables y, and satisfy here the inequality 


> |r(Irs ee “Ins t)| 
r= 


IIA 


A, 


(1.5) 
2, |¥| 


1 Q. Perron, Uber Stabilitét und asymptotisches Verhalten der Integrale von Diffe- 
rentialgleichungssysteme, Math. Zeitschr., 29 (1929), pp. 129—160. 
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further for an arbitrary small «> 0 two positive numbers O(e) and 7,(s) can 
be found so that for 

(1. 6) t=.7,(8), |i) = 6), +--+ |p =O) 

the inequality 


|W, 1. + Yn, t)| 


>, |y| 

yv=1 

holds and finally the zeros 4; of the equations 
Qui—A ... Qin 


(1. 8) D(4) = la 
Qi one Ann —h | 


Sear 


(isi) 


are all in the right open half-plane, then complete instability occurs. 


2. In what follows we shall give first another criterion for the complete 
instability which weakens (1.7). We consider throughout this paper systems 
(1. 1) where 


(2. 1) min NAv=—=L AO 
Vo) S ccus tt 

and 

(2. 2) max |a,;|—=C 


1S=¥,j=n 


are fixed. Let D be such that 


__ Mlog(4C) + log (162) | 


(2. 3) D a 


in this case we have evidently 
(2. 4) et) — 16n(4e)’. 
Then we shall prove the 


THEOREM I. /f for some a>O the functions w,(j,,-...,V,,t) are in the 
domain 


(255) EO) 0) sa aa vee ee 
continuous and here with above D 

 |We(I» +r Pur OP 1 

) pe Raed. Soe 30n D? 


(2. 6) 


e-ancD 
= | yl” 
k=1 

holds, then the solution X,(t)==0 is completely instable.? 


> Of course, it would be sufficient to require everything for t > c only. 
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Surprisingly, on the right side of (2. 6) we have a positive constant, 
dependent only upon easily calculable parameters of the system (1. 1). 
PERRON’s proof of his theorem was based on an explicit lower estimation of 
the norm of the solutions for all values ¢, valid, however, only in the special 
case 


(2. 7) dy ==0 Ci?) 
Our improvement was made possible by starting from an explicit lower esti- 


mation of the maximum of the norm in finite intervals. This inequality will 
be an easy deduction from Theorem VIII of my book.’ 


3. If we replace the domain (2.5) by the domain 


(3. 1) Dee Oe es Vo5/> Ya arbitrary 
and 4 is so large that 

{3. 2) A>) 

and 

43,3) ets = 3n(2e(1+24))?", 


we assert the following 


THEOREM II. /f the functions w,(j,,...,¥n,t) are-in the domain (3.1) 
continuous and here 


| i 


ee wi(yr, oie Yn = t)|? 1 e nC (A2+-A) \9 
€ 4 (ek e \ . hs 
Se =) 4n(a+4) (2e(4+0)" | 


holds, then each interval of the length (4°4+- 4) lying in t =0 contains a t* 
with 


reo) Be | X;,(¢") 


= 


Wt 


2> els a 2, |Xi.(0)/’. 


This inequality is in a certain sense best-possible, even for a large 
subclass for the systems for which Theorem II refers. We consider namely 


systems AG G 
(3. 6) | ee Zi VO (9222, 1,.2)10pn) 
where for 1= ,/ = the functions f,,(¢) are for ¢ =O continuous, for each 


Pee foes ni ; 
ISItG Jay bo eee a7 
t>+o 


3 P. TurAn, Eine neue Methode in der Analysis und deren Anwendungen (Budapest, 
1953), p. 42. This book contains already a weak result in this direction, rather only to 
indicate the possibility of application of the method also in this field. The results of the 
present paper are, however, much stronger and also a gap in the former proof is now 


eliminated. 


3 Acta Mathematica VI/3—4 
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exists and L>O. It is easy to see that condition (3.4) is in this case for 
t>c)—¢)(4) fulfilled and also the continuity requirement (the w,’s are now 
linear in all y,’s). Hence Theorem II gives at once that each interval of 
length (4° Wicceke in {=O contains a ¢* with 


(3. 7) DX" + Ci) =e AY, wa Sy = |X (Co) |’. 


But according to a part of the well-known theorem of POINCARE—PERRON, if 
NA, = min KA; = L > 0, 
J 


then the system (3.6) has a (Y,,..., Y,)-solution with 
(3.8) Fim Flog (\¥i) +++ +|¥al) =L. 
Since 

div.ors (S101) sa yv-0F, 
(3. 8) implies 
(3.9) lim Fog (Si ¥.(? jeez 


t+>+@ 


Writing (3.7) in the form 


2 (t* — 


S| xcenps dha) Six, cepp, 
eae | vy=1 
we see at once from (3.9) that the inequality 


1 erate (t- a v |X» (0), 


instead of (3.5), with a universal but oe small 7 >O would be cer- 
tainly false. 

The Theorems I, If deal exclusively with that case, when all the zeros 
of the characteristic equation lie in the right half-plane. It would be ‘of 
interest to obtain similar results also for the more general case, when only 
some zeros are in the right half-plane, when in PERRON’s terminology con- 
ditional stability occurs. In such investigations instead of Theorem VIII the 
Theorem IX of my book can play a role. 

The fact that in Theorem I instability could have been refined to an 
explicit inequality seems to me of some importance in the applications, e. g. 
it can mean a new approach to astronomical age-estimations. 

The Theorems | and II can be extended also to systems of difference 


equations. We shall not go here into details of this. I shall return else where 
to an algebraic application. 
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4. Next we turn to the proof of the theorems. As previously told they 
are largely based upon the following theorem of my book. If 


(4. 1) Jia, =O (= ee) 


and #, are arbitrary complex numbers, then for arbitrary positive numbers a 
and d the estimation 


(4. 2) max | > sex 
aSt=a+d | j=1 


: é d y#| n | 
= aaa) 22 
holds. Since the proofs of Theorem I and II run parallel we perform them 


parallel in order to avoid unnecessary repetitions. 
Let b =O be fixed and beside the system (1. 1) we consider the system 


(4. 3) aor = > a,;x;(t) (Jee lr) 
j=! 


with the initial conditions 
(4. 4) ee 0) == X,(0) VE a Be acne 13 


Let us first suppose that the zeros of ®(Z)=-O in (1.8) are all different. 
Then the required solution of (4. 3)—(4. 4) is with suitable c,,’s 


x, (1) = >, Cries! a8 Pepe ae 
j=1 


We put 
(4. 5) t,t) =2,(Neu aD cache CSS 
We apply (4. 1)—(4. 2) to w,(t-+-6), first (for Theorem 1) with 
(4. 6) a=D, d=D 
and then (for Theorem II) with 
(4. 7) ade ea = 4, 
Then we get in the first case for y-—1,2,...,n 
(pmax, be(Diev— max |wo(t+ B)| = ri ‘yn()| = Race 
- e. eet | 
(4. 8) Nea oe |x» (t)| = (dey 'X1(8)|- 


In the second case we get 


ax Hlet*— max |yp,(¢t+6)|= 
se ctlia® ge A=t=A4+A ‘ 


hh 


ray) YOl= (sacepay) ole, 
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(4. 9) max |x»()| =- eT Gee eee 


DEA Sts ota (2e(4+1)) 


Since in (4.8) and (4.9) nothing depends upon the configuration of the 4,’s 
and a polynomial can be approximated, uniformly in all finite intervals, by 
polynomials with exlusively simple zeros, a trivial limiting process results 
the validity of (4.8) and (4.9) without any simplicity requirement on the 


Z's. If further /, is an index with 


nt 


xP = > GOP, 


j= 


we obtain from (4.8) and (4. 9) 


eal 
m t = = 
max |x; ( P= ae LX) af)P = —< = aa x;,(0)/? — 
(4. 10) ; e2Lp ~~ = e2hD a : 
= Gorn qi Ol = Fao ell 
4.11 Sai cece 88 
( ) b+ a2 A od ra Z(H F = n{2e(4+1)}*" 4 > XP, 
respectively. 
5. Further we shall need some lemmas. 
LEMMA I. For the function 
(5. 1) g()= > nee 
i} 
with 
(ez) Nod, = 0 ({= 1,2, ...,n) 
and 
(5: 3) 0O<A, = B, = C, =D, 
we have’ 
D=AY 
5.4 a - 
(5.4) max, |g] = (2e2—*) max, |e) 


The proof follows easily from (4. 1)—(4. 2). Putting 
> Bert = hh) 
j=1 
(4. 2) means : , 
(O20) max |A(t)|= | 


asSt=atd 


d 
Belapay) MO 


* This Lemma occurs in my book, p. 70 for the case 6; —0 (Sh 


1 used it only for this case. 


ey? eSICe 


ON THE INSTABILITY OF SYSTEMS OF DIFFERENTIAL EQUATIONS 263 


If |g(¢)| assumes its absolute maximum with respect to [A,, D,] at f= #, and 
B, =t,=C,, then (5. 4) is trivial. Consequently, we may assume without loss 
of generality 


ate bc De 
We have simply apply (5.5) with 
h()—g(t+4), a=B,—t, d=C,—B.. 


This gives 
—_ at ie => G —B, i ae 
eA) Be, Pies onto : t)| =e 2e(C,—14,) ] |g(t,)| = 
x CER. ) 4 
i . 2e(D,— A) AAU Q. e. d. 


6. Next we reproduce for the sake of completeness the (short) proofs 
of two well-known lemmas; the first goes back to LIOUVILLE, the second one 
to LIAPUNOFF and PERRON. We consider beside the systems (1.1) and 
(4. 3)—(4. 4) for k=—1,...,n the functions 


Xi.1 (0), wey Xin (t), 
satisfying again the system (4.3) but with the initial-conditions 


\ 1 10f lm k, 
(6. 1) X1j(0) = | OantOn 2 Jc Ke: 


Then we have the 


LEMMA II. We have for v==1,2,...,n andt=b 
t ; 
X, (t) = xX, (t) + f} >, Xv (f + b—t)wi.(X, (0), -.-, Xa), o| dv. 
; J 1 k=l } 
b 


For the proof let 


t 


x,(t) + }} > ss (t+ b—)w,.(X,(t),.--, Xn (7), | dta=Z,(t) 


b 


6. 2) 
(veel yaa; nt) 


where the functions x,(t) and X,(t) are considered as given. We have ob- 
fiously 


6. 3) Z,(0)=x(b)= Xb) (¥= 1, A). 
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Further 


dZ,(t) __dx,(t) 
dipee eed +: wy(X,{f), .., Xn(t), 2) 


+f } PLE Mal ead eae) 2 (alae = WAXD) - ++» Xa), + 


t 


+d an(xo +f | D x(t + b— 2) (XC), «+1 Xo(0),7) 


dc|— 


== >) dy Z; (1) We Xen eet 
1 
i. e. (Z,,..., Z,) constitutes a solution of the system 


dZ,(t) 
dt 


But owing to (1.1) the same holds for (X,,..., X,); owing to (6.3) and the 
uniqueness of the system (6.4) we have 


Zi = Xu) a Oe, 


(6. 4) 


=> a,;Z;(£)+w,(X4(b), - <> Xalt), €) (vy =1,2,..., 0). 
j=l 


indeed. 
Finally we need the 


LEMMA III. When for the coefficient functions b,;(t) of the system 


(6.5) PADS Gilet) 1, ) 
j=l 

for b=t=T the estimation 

(6. 6) IG.()|=G  (syjsa) 


holds, then we have for b=t=T 


XN 


6.7) Slee sere» Sai byP. 
and 
6.8) Slate: eed 


PROOF. We have for y—1,2,...,7 


= Glz| Sz) = oy elt 
=-Gle| Dials =—Ga 


Zrf +1 25|, 
pot 
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n 


Summation with respect to » gives with > lz, Pot) 
v=1 


Tes . [Pe 
a ¥ (t) = Gng(t), 5 # (tf) = —Gngi(t), 


ee aoe Gi 
aie Jeet) ex) ap ee) = 0. 
Integration from 6 to ¢ gives already the required inequalities. 
Applying Lemma III to the functions 


Xi (0), oeey Xin (t) 
we obtain for kK—1,...,;n and t=6 


(6. 9) > | Xn;(t) ie = e2nc(t -b) 
i— 

and 

(6. 10) > | Xi; (t) |? = e-2nC(t-b) | 
jet 


7. Next we turn to the proof of Theorem I. We suppose the theorem 
to be false, i. e. there is a solution (X,,...,X,) not identically vanishing 
for which 


(7.1) > 1XOP<a 


wl 
for t= 6); we may suppose without loss of generality that 
(7. 2) | 2 |Xr(6,))? > 0. 


We may apply Lemma II with b>=8, for »=—1,...,n, if 6b =f=h+2D- 
This gives 


X,(f)—x,(0)} =} 5 | Xev(t-+ 8>—)| |we(Xi(2), «25 Xn), o\ dv 


Or 
ix, )—x, Ors 2D | > a(t 0.— 2) J SX, Tea ite 
ta i 
re. 
> |X()—x(O)? = 

(7. 3) et a inp | ] 

< 2D Pa [xir(t+ bo — 7) | pa Wi ps Os ait dt. 

k= 1 y= a 


bo 
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Taking in account (6.9) we have in the range of integration 
a > Dd lett b— t)l & a= = ne” nC (t-1) = me2ne tbat = newer, 


i. e. from (1. is 
by+2D f 
(7.4) > |X,()—x,(t)P Ss 2nDe*? [ } Spw(X%(o), isha EB) 2) el dt. 
vl ‘. | » 
do 
Making use of the condition (2.6) (which is justified by (7.1)), (7.4) gives 


bot2D 


q 1 oe a 
>1X%,0—~ OF = aap J |S ixcoplae = 
(7.5) 
bot 2D en 


(es) 


on J } Sia (r) Pdr + J Pp DX) — mi 


bo 


Ut)= 2X |aOF 
and 
ViO— >| X—xt? 


assume for f= +" and t=’, respectively, their absolut maximum referring 
to [&,, 6,++2D], then the mean-value theorem gives from (7.5), when ¢ on 
the left is replaced by +’, 


ee E 4 
V(r9= 15 U(r") + 5 V(r’) 
or 
eae. ‘ 
(7. 6) Ve’) = < U(«"). 
Hence, if 
W(t) = 2 [Xi(t) | 


assumes its absolute maximum within (6), 6,--2D) at t=", then, taking in 
account that from 

|, /? = |v, + (u,—v,) P S (|r, P+ |u.—,/") 
we have for arbitrary u, and », 


(7. 7) eo / = + las P—la,—wP, 
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we get by (7.6) 


us eh 1. 2 
2, |X. = = Dm (t i = See Pe |x Xi ci [Xi (c")—x, (2)? x. 
-. c= k=] 
— ! . ‘4 — * 4 hs ] 
fe, UO)SVe => 5 Ue" )\— V(t’) = ie U(e") — 7 Ue") > Ue"). 
Hence 
5 a s > - ~ ; 2 
Spee 2) |X: CP ib x be < = |x (t)/ = 8», ie cane rh: _ |xi,(t) | 
and by (4. 10) 
~~ x Cn Nwe erly) a e % P 
ae |Xe(")P = ~Bn(4ee = | Xx (Bo) ? = 2 > |Xi(b0)/, 


taking in account (2. 4). Replacing 6, by this +” we obtain that for a suitable 
vt” with 

(Ope an 4 2D 
we have 


2 |Xele’”)P = 2 D1 Xee" MPS PD XP. 


Continuing this process we get the existence of a ¢> 0, with 


ne 


> |XOP>a 
1 


which contradicts to (7. 1). 


8. Next we turn to the proof of Theorem II. Let 6,=0. We apply 
Lemma II with b= 6, for v—1,...,n and 6,=t=6,4+4°4+4. Proceeding 
exactly as at the proof of Theorem | we obtain 

by+444+-4 


YX O—x (OP Ss (P+ Dynes i; \> SF » |W (Xin COC LT 
v1 : ) 


Applying now (3.4) it follows 


b+A2+A4 


81) DSIX)—n(Ps ENF | [dere 


When «* and +’ stand now for the place of the absolute maximum of U(f): 
ind V(t), respectively, with respect to (b,, b,-+ 4°-+ 4), we obtain from (8. 1), 
inalogously as in (7. 6), 


yan . 
y(n’) = AE ay + V0, 
8. 2) Ve = eacaee are rer 
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U(x*) is the maximum with respect to (0, 0,+4°+ 4); Lemma | gives pos- 
sibility’ to estimate U(c*) from above by 


max U(t) = U(ts) 


b+ AStH=b4+44+A 


with 
(8. 3) 64 7=45264+74+4. 
Let /, be such an index for which 
sez = S ne h—z_ Ue): 
then 
(8. 4) UC) Ss Nix (ee i ee |x; (f)|*. 


Applying Lemma I to |x;,(t)|? we obtain, taking in account the remarks after 
(4. 9), 


MaXeee (2b) s(2e44 


b StSbr+h4+4 


AeA ; 
Fay" max xP 
b,+4St=b,4+444 


=(2e(4+ 1)" max Yu (P= (2e(4-+1)} UC). 
+A S=t=b,+A24A a 
Thus (8.4) gives 


U(e*) S n{2e(4+ 1)" U(ts). 
This, together with (8. 2), gives 


(8.5) V(e') = 5 U(t). 
Then 
max Dies (f)P= DHE: t) P= 5 Ut) — V(t) = = 


byt RStS0 tad ya 
= = U(t,)— V(t’) = * U(ts), 


using (7.7) and (8.5). The inequality (4. i gives then 


~~ 


ue e Way 
a 2 
Wve ce +A — | Xi (t) ha j = On ea Le ] Qn Fame >| Xi; (b,))° 


(8. 6) " 

= eu S1Xb)P, 

using (3. 3). - 
First we apply (8.6) with 6,—0. This gives the existence of a +, with 

ayis44+4 


>» As Vera T. Sos remarked, a similar but weaker inequality can be deduced without 
Lemma I, using (6. 8). 
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and 


Be (G(i) eee 2 |X,,(0) 
Next we use (8.6) with 6, 7,. This gives the existence of a +, with 


Es Sis hie’ -a 


9 


and such that 


a, |Xulea)P = ee 9 S| Xi(r)P S49 SX.) 
= = (eal 


D) 


Continuing this process we obtain the existence of a sequence 


(Omes ty =), Ey <=: 
euch: that! for 2=—=1, 2,... 


(8. 7) Tmitas Tm == Trittt+ad 

and 

(8. 8) Dias) pes OO > |X, (0)? 
k=l k=1, = 


Since from (8. 7) 
Tim = (a +4), 
we have 


2 = em 2 it 
taking in account that owing to (8.7) each interval in. t=O of length 
(4° +4) contains at least one 7;, Theorem II is proved. - 


(Received 8 August 1955) 
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BbINOJHAOULerO yCOBHE 
ve 
au ‘ - 
O02 > (x, OP =e 
val 
MOKKHO Halitnh 1H600 Taxoe f, > 0, uTo pA t—-f) pemleHue He CyLeCTBYyeT, 1u60 TaKOe 
t; > 0, uro 
” 
n 2 
> |X, @)P Ze. 
yl 
Yayuwasi B HEKOTOPOM CMbICae AOCTaTOUHOe ycuoBne Ile ppoOua, aBTop AOKAa3bI- 
BaeT J[Be TeOpeMbl, ONMpaach Ha Teopemy VIII cBoeit KHHrH UNTHPOBaHHO! Ha CTP. 259. 
Nycrb ama KOpHen 21, ...,4n YpaBHeHHA 


a, Lae, Le ay, 
: 0 
any ay 
HMeeT MeCTO ; 
min RA,—=L>O, 
7 Ts oerer 00 
Hu nyCTb 
eee 3n + log (167) 
: 27 : 
Ilyctb fanee 
ae |a,;] = C. 
fF 


Torga umMeeT mecro Cnefyroulan 


Teopema I. Ecan ana nexoroporo a> 0 yepes BeakytO TOUKY OOAacTH 
EOWA Sea, Vel a a 
NpOxoANT eAMHCTBEHHOe pewenne (1) 1 : 
vw 


> IM. Orn eile J Vans t) |? 


pas | Seis 1 e 4nCD 
eo > ’ 

iis ~ 30n D2 

ly, 

od OK 


k=1 


TO (2) ABAMeTCH BNOJHE HCYCTOHYNBLIM pewenneM (1). 
Ilycrh Tenepb uncno 4 cTOnb BeTNKO, 4YTO COPaBeAIMBO HEPaBeHCTBO 


(3) e7h4 = 3n(2e(4 + 1))". 
Torfa umeet MecTo 


Teopema Il. Ecan uepes sesakyto rouky n-- 1-MepHoit oGnactu, onpeneanemoii 
f-- 0 M MpOusBOABHHIMH KOMMACKCHHIMN yy, ..., ),,, NPOXOANT eANHCTBeEHHOe pewenne (1) 1 
B 9TOH OONACTH 
ns 
2 err 2+ or Inn DIF F ' ; 


1 } —4n(22 ac a) : (2e(A ae 1)y" ’ 
> |r? 
k=1 


nC (A?4-A) 2 


TO BO BCAKOM HHTepRane AHI 4? ~~ 4, neExKauem B ft >: 0, cyuyectByeT TOuKa ¢* TaKasi, YTO 


ie( 


Sixemese + A > Lx. 
bese 


ja 


— 
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Aprop HaMepeH yKasaTb OHO anreOpanueckoe cnenctRHe Teopempt II B Apyrou pasore. 


DIE GRUPPENTHEORETISCHEN ZETAFUNKTIONEN 
UND DER SATZ VON HAJOS 


Von 
LADISLAUS REDEI (Szeged), Mitglied der Akademie 


§ 1. Einleitung 


Der Satz von Hajos iiber die endlichen Abelschen Gruppen ist einer der 
bewunderswertesten in der Mathematik. Die beiden Hauptcharakterziige des 
Satzes sind seine Vielseitigkeit und die tiberraschenden Schwierigkeiten seines 
Beweises. Unter seiner Vielseitigkeit verstehe ich, dai der Satz eine ganze 
Reihe dquivalente Umformulierungen zulaBt, die teils sehr wichtig sind und 
in verschiedene Gebiete der Mathematik hineingreifen. Als solche Umformu- 
lierungen nenne ich die beriihmte Minkowskische Vermutung iiber den 
»Grenzfall“ des homogen linearen Ungleichungssystems und iiber die raum- 
zerlegenden Wiirfelgitter (vgl. Hajos [1]).'. Auf viele weitere, allerdings weni- 
ger wichtige. Umformulierungen st68t man, wenn man versucht fiir den Satz 
einen neuen Beweis zu gewinnen. Auf solchem Wege bin ich neulich durch 
den Satz von Hajos zur Entdeckung meiner Zetafunktionen (vgl. REDE! [2]) 
geleitet worden, auch entstand dabei eine neue Aquivalente des Satzes, die 
der einzige Gegenstand der vorliegenden Arbeit sein wird. Es wird sich 
zeigen, daf der Satz von HAjOs einer Poleigenschaft von gewissen solchen 
-Zetafunktionen gleichkommt. Der Beweis wird durch den ebenfalls mit Hilfe 
meiner Zetafunktionen entstandenen tiefliegenden Tragheitssatz der endlichen 
Abelschen Gruppen (vgl. REDE! [2], Satz 9) erméglicht. Mit Hilfe meiner 
Umformulierung des Satzes von Hajos einen neuen Beweis fiir diesen Satz 
zu finden, ist mir nicht gelungen. Zum Erfolg wiirde vielleicht verhelfen, wenn 
man die Theorie meiner Zetafunktionen weiter ausbaut. Ich bemerke noch, 
daf fiir den Satz von HajOs aufer seinem Originalbeweis und seinen Vari- 
anten bisher nur noch ein zweiter, wesentlich verschiedener, von mir kiirzlich 
veroffentlichter Beweis vorliegt. (S. HajOs [1], REDE! [3] und die Literaturan- 
gaben in der letzteren Arbeit.) 


1 Mit [ ] verweisen wir auf das Literaturverzeichnis am Ende unserer Arbeit. 
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§ 2. Die Umformulierung des Satzes von Hajoés 
mittels Zetafunktionen 


Durchgiingig werden G eine endliche Abelsche Gruppe, 7 eine natiirliche 
Zahl, p,,---, Pn (nicht notwendig verschiedene) Primzahlen, «,,..., ¢, Elemente 
von G, ferner o(@) (« € G) die Ordnung von @ bezeichnen. 

Der Satz von Hajos lautet: Wenn die p,...p, Produkte 


(1) Ore ae (x:==0,>.., ely tale) 


eine Gruppe p,...p,-ter Ordnung bilden, so gilt o(¢:)—p; fiir mindestens 
ein i. 

(Der Satz gilt sogar auch dann,» wenn man an Stelle von p,,..., DP» 
beliebige von 1 verschiedene natiirliche Zahlen nimmt, jedoch ist diese Ver- 
allgemeinerung nach Hajos [1] unwesentlich. Fiir einen kurzen Beweis s. man 
REDE! [3], Hilfssatz 2.) 

Wir fiihren noch die folgenden, ebenfalls durchgdngigen Bezeichnungen ein: 


Xt die Menge der Zahlen 1,..., 2. 

0 die leere Menge. 

(...) die Anzahl der Elemente einer endlichen Menge, insbesondere 
die Ordnung einer endlichen Gruppe. 

{---} die durch die eingeklammerten Elemente erzeugte Gruppe. 

« das Einselement von G. 

A,,..., A, zyklische Untergruppen von G. 

B,=Aj',...,B,—= A (d. h. B; die Gruppe der p;-ten Potenzen der 
Elemente von Agri ly5.34 7): 

Wt eine Untermenge von % (in Zeichen WiC MN). 

P» das Produkt der p; mit 7€ Mit. 

Ay, das Produkt der A; mit 7€ Mi. 

By, das Produkt der B; mit 7 € Wi. 

Wir setzen (wie in der Arbeit REDEI [2] (1)) 
(2) 0(z)=0(25 Ai, --+) An) = DY (—1)™(An)™ 

MON 

mit einer komplexen Variablen z und nennen [(z) = (z)‘ die (zu den Unter- 
gruppen A,,...,A, gehdrende) Zetafunktion. Unter den zwei Funktionen 
o(z), $(z) werden wir nur die erste verwenden, aber alle unseren auf 0(z) 
beziiglichen Aussagen lassen sich auch auf C(z) beziehen. Insbesondere ist 


* Im Fall XO ist freilich py,—1 zu verstehen, wenn ferner 9 aus dem einzigen 
Element i besteht, so ist py,—p, zu verstehen. Diese Bemerkungen sind sinnma®ig auch 
auf andere dhnliche Falle zu beziehen. 

° In Réper [2] wurde ¢(z) fiir viel allgemeinere Falle definiert, hier wird aber nur 
der obige Fall und zwar nur fiir die (reellen) ganzen z in Betracht kommen. Man bemerke, 
da in (2) die Reihenfolge der A,,..., A, gleichgiiltig ist. 
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fiir 2== © ,0(%)—O* gleichwertig mit ,z—z, ist Polstelle der Zetafunktion 
c(2)*4 

In dieser Arbeit werden unter allen Funktionen o(z) nur die 
(3) Oy, (2) = 0(z; B;, As, Ay, 5) eds) B;,, Ax/ Ax) (Mi ci) 
zu Wort kommen, wobei i,,...,é, die samtlichen verschiedenen Elemente 
von Ji—Wt bezeichnen. Insbesondere ist also fiir It —0O 


(4) b0(2)=20(2- Di, «2.5 Bn): 
Gleich bemerken wir, da sich (3) wegen der fiir alle Untergruppen U, V 
von G giiltigen Formel (UV/U)—(U) ‘(UV) und wegen (2) als 
(5) em(z)—=(Am)* >? (—1) (Am Be)” (Mic %) 
LEMN-M 
schreiben 1aft. 
Die gemeinte Aquivalente des Satzes von Hajos ist der folgende : 
SATz 1. Wenn 


(6) (An) = Pr, 0» (1) =——() (Mi Ee dt) 
_gelten, so gilt 
(7) Q9(2) = 09(3) = --- = 0. 


Hiernach ist der Satz von Hajos in der Tat dquivalent mit einer Polei- 
genschaft von Zetafunktionen. Satz 1 kénnen wir in einer einfacheren Form 
aussprechen, die auch fiir den Beweis geeigneter wird. Fiir eine beliebige 
Funktion o0(z) in (2) ist namlich @(2)— 0(3)— --- —O (vgl. REDE! [2], Korol- 
lare der Satze 10,2) gleichbedeutend damit, dai o(z) konstant, d. h. min- 
destens ein A; gleich « ist. Wegen (3) ist also (7) gleichbedeutend damit, 
daf mindestens ein B; gleich « ist. Indem wir auch noch (6) wenig umfor- 
men, kénnen wir nunmehr Satz 1 so aussprechen: 


Satz 1’. Wenn 
1 1 
y px As)’ 
ist, so ist mindestens ein (B;) gleich 1 (i=1,...,N). 
Es geniigt, wenn wir die Aquivalenz vom Hajésschen Satz und vom 
Satz 1’ ausweisen. 


Oy, (1) = 0 (Price Jt) 


§ 3. Beweis der Aquivalenz vom Hajésschen Satz und vom Satz I 
Zu (5) ahnlich definieren wir die Funktionen 


(9) An (2Z) = >) (1) pe'(An-2B)* — OCMEN), 
; Lom 


4 Wenn eine (komplexe) Funktion identisch gleich x ist, so sagen wir, dab sie iiberall 
einen Pol hat. 
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die iibrigens nur fiir z—1 verwendet werden. Fiir diesen Fall lautet (9) so: 


(10) Ay (1) = >) (—1) pa’ (An-2Be)' . (OCMC). 
Lem 


Es wird sich zeigen, da sich die Pramisse des Satzes von Hajos mit Hilfe 
dieser 4y(1) ausdriicken Jafit. 

Zu diesem Zweck benétigen wir den Ring 3(G) der Gruppe G iiber 
dem Ring 3 der ganzen Zahlen. Die Elemente von 3(G) lassen sich ein- 
deutig als 

C=O Yet +> +FCoYo 
schreiben, wobei 7,...,7, die von « verschiedenen Elemente von G und 
C;,...,¢, ganze Zahlen sind. Wir setzen 


(11) lol. = 
und nennen diese Zahl den Wert von o. Offenbar gilt 
(12) |sotitc|.—slo|e+t|t|. (s,f€ 3; 0, cr € 3(G)). 


Fiir eine Untermenge H von G, bestehend aus den Elementen m,, ..., @,, 
setzen wir 


(13) [H] =o,+--- +o, (€ 3(G)) 


und nennen es die Summe (der Elemente) von H. 
Nunmehr besteht zunachst der folgende: 


HILFSsATz 1. Gilt die Prdmisse des Satzes von Hajos fiir @,,...,@n, 
so gilt sie auch fiir 


(14) it, ..., a” (pXk; i=1,...,0), 
Ferner gilt dann auch 
(15) pi\o(a@) (i= 175.7; n). 


Der leichte Beweis findet sich in REDE! [3], Hilfssatz 3. 
Wir nennen 


16 ; Cand =| 
aN), e ieee 


kurz ein System. Werden héchstens n—1 (eventuell keine) Spalten von (16) 
gestrichen, so ensteht ein Teilsystem von (16). Ist kein Produkt 


(17) els (DiXKi; O< ki < 0(a); i=1,...,n)9 


gleich ¢, so nennen wir das System (16) gut. Wir chennen es vollstindig gut, 
wenn alle Teilsysteme gut sind. 


i 


HILFSSATZ 2. Die Priimisse des Satzes von Hajos ist gleichbedeutend 
damit, dap 


(18) (acer espe, ore 
gilt und das System (16) vollstdéndig gut ist. 
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Denn nehmen wir zuerst die Erfiilltheit der Pramisse des Satzes von 
Hajos an. Dann machen die Elemente (1) eben die Gruppe {«,..., Gn} aus, 
woraus (18) folgt. Auch folgt nach Hilfssatz 1, da fiir die k,,...,, in (14) 
die p,... P» Produkte 
(19) a... aint (Xp OF, Pils te 1,2) 
eine Gruppe bilden. Da (19) fiir x,—---—x,—0 gleich « ist, so folgt, daf 
(19) von ¢ verschieden ist, wenn jedes x,,...,x, eine der Zahlen 0,1 bedeu- 
tet aber nicht alle gleich O sind. Da das insbesondere fiir die k; mit p, 4 kj, 
O0<k;<o(@) (i=1,...,2) gilt, so folgt, daB das System (16) vollstandig 
gut ist. 

Umgekehrt wenn (18) gilt und (16) vollsténdig gut ist, so folgt aus 
letzterem, dafi die Produkte in (1) verschieden sind, ferner folgt aus (18), 
dai diese eben die Gruppe {a,,...,@,} von der Ordnung p,... p, aus- 
machen, also die Pramisse des Satzes von Hajos erfiillt ist. Somit haben wir 
Hilfssatz 2 bewiesen. 


HILFssATz 3. /m Fall (15) ist das System (16) dann und nur dann gut, 
wenn fiir 


(20) A;= {e@;} Ue 8 eee) 
die Bedingung : 
(1) TL(Al—B)) = 0 


erfiillt ist. 
Aus (15), (20) folgt namlich, da®B B;— A?'={a?"} aus den Elementen 
ei! (pilki; 0 = ki < 0(a))) 
besteht (i —1,...,7). Weiter folgt hieraus, dafi jetzt das Produkt in (21) 


eben die Summe der Elemente (17) ist. Dies bedeutet die Richtigkeit vom 
Hilfssatz 3. 


HILFSSATz 4. Wenn 


(22) TAA, eee Ge, TT) 
ist, so gilt 
(23) | T[(Al-[B)) =A) + (As) tal, 


Offenbar gilt namlich fiir das ,Anfangsglied“ des (ausmultiplizierten) 
Produktes auf der linken Seite von (23): 


n 


171A) = 9 As + Aad 


(Dies ware ja sogar fiir beliebige, nicht nur fiir zyklische Untergruppen von 
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G richtig.) Wegen A,--- A, Ax und |[Ax]|e—=1 gilt also 


; (Ai) «+: (An) 
Ai]| =—-—: 
(24) TIA), (An) 
Andererseits beriicksichtige man, dafi (22) und 
1 
(25) (B;) = De (Ai) (ia 4 eee) 


gleichbedeutend sind. Wenn man das Produkt auf der linken Seite von (23) aus- 
multipliziert und auf die so entstandenen 2" Glieder die Formel (24) anwen- 
det, so bekommt man fiir die linke Seite von (23) wegen (12) und (25) den. 
Wert 

Spy (A,) --- (An) 


= 


NER Dx (Ay, —M By) 


Dies stimmt nach (10) mit der rechten Seite von (23) tiberein. Das beweist 
Hilfssatz 4. 


HILFSSATZ 5. /m Fall (15) ist das System (16) dann und nur dann voll- 
stindig gut, wenn fiir (20) die Bedingung 
Ay (1) = 0 (OcCMEN) 
erfiillt ist. 
Da namlich aus (15) und (20) das Bestehen von (22) folgt und in die- 


sem Falle nach Hilfssatz 4 die Gleichung (21) mit 4(1)—0 gleichbedeutend 
ist, so folgt aus Hilfssatz 3 die Richtigkeit vom Hilfssatz 5. 


HILFSSATZ 6. Die Prdmisse des Satzes von HaAjos ist dquivalent damit, 
daps ftir (20) 


1 1 v é 
(26) i Uy Oo 4 =0 = OcMEN) 
gelten. 


Dem Beweis schicken wir die Bemerkung voran, da nach (10) ins- 
besondere fiir Yi—=7 
tn ee we 
A) p(B) “= 
gilt, also in (26,) die Bedingung (22) enthalten ist. Andererseits ist in der 
Pramisse des Satzes von HAJOs die Bedingung (15) enthalten. Man bemerke 
auch, dafi (22), (15) im Fall (20) gleichbedeutend sind. Hieraus und aus den 
Hilfssdtzen 2, 5 folgt die Richtigkeit vom Hilfssatz 6. 

Wir verwenden fiir 4,(z) auch die ausfiihrlichere Bezeichnung 


(28) Ay (Z) — A(z : Ai, Ri evet A,). 
(In der Wirklichkeit hangt 4(z) auch von p,,..., p, ab.) 


(27) 41) = Linden) 
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HILFSSATZ 7. Jst 


(29) pit (An); 
so gilt 
(30) (lp, (A a2 A Ag Any Ay i Ay A): 
Nach (9) ist namlich 
(31) Ay (2) ses (—1)™ pa (An Bur) *. 


- Wir bezeichnen mit Xv’ die Menge der Zahlen 1,..., »—1. Durchlauft Nt die 
Untermengen von Xt’ und bezeichnet 9, die Vereinigungsmenge 9tUn, so 
durchlaufen Wi, Wi, insgesamt alle verschiedenen Untermengen von %. Da 
(29) mit B, —A, gleichbedeutend ist, so gilt dabei stets 

Ay; MN, By, = Ay, By. 


Somit folgt aus (31) wegen (9t,)=(M) +1, pm = pnp 
(32) Ay (Z) = (1 —pn’) 2 (1) pai (Ann Bo) 
Nun gilt auch a 
(Axx Ba.) = (Asya Br An) = (An) (Asv 9 Bay An,/ An). 
Wird dies in (32) eingesetzt, so entsteht eben (30). Das beweist Hilfssatz 7. 


HILFSsATz 8. Stets gilt 
(33) An (1) = 0 OcMEN). 


Es geniigt (1) =O zu beweisen. 

Im Fall n==1 ist nach (27) 

1 1 
(Ay) p(B) © 


Da stets (A,;) =p,(B,) ist, so ist die Behauptung fiir diesen Fall richtig. Im 
Fall n = 2 setzen wir die Richtigkeit der Behauptung fiir n—1 voraus. Zuerst 
nehmen wir an, dafi auch (22) gilt. Da die linke Seite von (23) wegen 
Bc A, (i= 1,...,n) nichinegativ ist, so-folgt aus Hilfssatz 4 jedenfalls 
~ dn(1) = 0. Wenn dagegen’ (22) falsch ist, so diirfen wit annehmen, dafi eben 
prt (A,) ist. Jetzt folgt die Behauptung aus der Induktionsvoraussetzung und 
aus Hilfssatz 7. Somit haben wir Hilfssatz 8 bewiesen. 


A, (1) = 


Hitrssatz 9. Es gilt die Indentitat : 


_ = 1 
Oe ee OL 7 on (2): 


pr (An) 3 omen Pym te Px-m (Am) 
Es geniigt den Beweis fiir den Fall z—1 auszufiihren, da sich der 
allgemeine Fall ebenso beweisen 1afit. (Ubrigens werden wir (34) nur mit 


4* 
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z—1 anwenden.) Fiir z—1 lautet (34) nach (5) und (10) so: 


144 Ss FO" 
(35) Px (Ax) orcmeR LCM Px-m Pg Ayy-¢ By) 
-> > Ns: 
MER LOR-M Px-mn (Ax By) 


Links und rechts durchlauft & alle Untermengen von 9%. Nach leichter Umord- 
nung der Glieder und Beriicksichtigung von px-»Pe— Px-cx-y) lautet (35) so: 


l Ko! N (2) 1 
=m est | _— 
Dae , a Ps-~n-2)(Am-g Be) 
(36) m= 0 
Ss ———— ] 
(Ax) cE »& 4 ) Px-m(Am Be) ” 
5] st 


wo man links und rechts in der inneren Summe iiber 9¢ zu summieren hat. 
Man kann auf beiden Seiten das erste Glied in die Summe einschmelzen, so 
daf man links auch It—0 (fiir —0) bzw. rechts auch Mi—= MN (fiir &—0) 
zulaBt. Dann wird die Richtigkeit von (36) augenscheinlich, womit Hilfssatz 9 
bewiesen ist. 


HILFSSATZ 10. /m Fall 


(37) (Ax) = px 

gelten dann und nur dann alle Gleichungen 

(38) Ay (1) = 0 (OC MCN), 
wenn alle Gleichungen 

(39) oy, (1) = 0 (MeN) 
gelten. 


Nach meinem Tragheitssatz (REDEI [2], Satz 9) gilt namlich stets 0 = e(z) 
(z= 1,2,...). Insbesondere folgt hieraus 
(40) om(1) = 0 (MeN). 
Wenn nun (37) gilt, so fallen in (34) die ersten zwei Glieder heraus. Wird. 
also Hilfssatz 9 mit z—1 angewendet, so folgt aus ihm wegen Hilfssatz 8 
und (40) die Richtigkeit vom Hilfssatz 10. 

Nunmehr beweisen wir die Aquivalenz vom Satz 1’ mit dem von HajOs 
wie folgt. Die Pramisse des Satzes von Hajos ist nach den Hilfssatzen 6, 10 
aquivalent mit der vom Satz 1’ fiir die A,,..., A, in (20).° Dabei folgt nach 
Hilfssatz 1 aus der Prémisse des Satzes von HajOs das Bestehen von (22) 


® Man beachte auch, daf durch (20) alle iiberhaupt méglichen Faille fiir die Ay, ..., A 
erschopft sind. 


n 
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fiir die gesagten A,,...,A,, somit 14B8t sich dann die Konklusion dieses 
Satzes auch so aussprechen, dafi mindestens ein B; (i—1,...,n) gleich « 
ist. Somit ist die Aquivalenz vom Satz 1’ mit dem von HajOs bewiesen. 


(Eingegangen am 23. September 1955.) 
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t-PYHKUMM B TEOPMM PPyYMM UW TEOPEMA XAMOILLA 
jin Pene nw (Geren) 


(Pe3 Me) 


Teopetuko-rpynnonaa Teopema Xai O ua paBHOCHAbHa TEOPeMe, OTHOCALICHCA K BbI- 
QBHHYTBIM HefaBHO aBTopom [-dbyHKunam (cM. Pejen [2]). Cormacno ato Teopeme ecan 
HeKoTOpble ¢-(pyHKIMM MMeIOT MOC B TOUKe Z=1, TO OAHA OMpefeneHHay u3 HUX TOKe- 
CTBeHHO GecKOHeYHa. JloKasaTeAbCTBO 9TOTO OCHOBbIBaeTCA Ha TEOPeMe HHEPUMH KOHCYHBIX 
adeneBbIX rpynn, KOTOpasd Oblaa JOKasaHa B YNOMAHKYTOM CTaTbe TOKE C MOMOUIbIO (-SyHKUMI. 
THM NYTEM MO*KHO OMKUJaTb HOBO AOKAsaTeEABCTBO TeOpembl XaOwa, ObITh MOKET 
nyTeM flaMbHeMuIerO pasBUTHA TEOPHH YNOMAHYTHIX ¢-(pyHKuHit. 


GENERALIZATION OF AN INEQUALITY OF KOLMOGOROV 


By 
J. HAJEK (Prague) and A. RENYI (Budapest), corresponding member of the Academy 


In what follows P(A) denotes the probability of the event A, M(é) the 
mean value, and M(&|A) the conditional mean value, under the condition A, 
of the random variable &. 

The inequality of A. N. KoLtmoGorov [1] in question states that if 

§1,6,...,&,... iS a sequence of mutually independent random variables 
with mean values M(&,) 0 and finite variances M(&)—Di (k—1,2,...), 
we have, for any «>0, 
(1) P( max |§+8-+---+&|29) = 4D Di. 
This inequality is extremely useful in proving the strong law of large num- 
bers and related theorems. In what follows the inequality (2) will be proved 
which contains (1) as a special case. The use of (2) instead of (1) makes 
it possible to simplify the proofs mentioned. 

The inequality (2) has been found in 1953 by the first named author; 
the proof of the inequality given below is due to the second named author. 

The following theorem will be proved: 


THEOREM. /f &,&,...,&,... ds a sequence of mutually independent ran- 
dom variables with mean values M(&,) 0 and finite variances M(&)= Di 
{k==1,2,...) and cq (k=1,2,...) is a non-increasing sequence of positive 
numbers, we have for any «>0O and any positive integers n and m (n<m) 


(2) P( max e|&+&+~ +5/29s4(8 > i+ >) ciDi). 


n=k=n k=n+1 


Proor. Let us put 


m-1 


(3) CS Et Bt +8) eh) + eB t + En) 
It follows 
(4) MO=c > Pe > Ds 


k=n-+1 


Denoting by A, (r=2,n-+-1,...,m) the event consisting in the simultaneous 


282 J. HAJEK AND A, RENYI 


validity of the inequalities’ 
ClE&+---+6/<2@ (ass<r) and ¢|&+-- -+&,.|/ =e, 


the inequality (2) can be written in the form 


(5) > P(A) = 4M). 


r= 


The inequality (5) is the consequence of (6a), (6b) and (6c) of which: 
the first two are evident: 


(6a) M(¢) = >» M(¢|A,) P(A,), 


m-1 


(6b) M(5| A) = 2M (i+ -+&) A, Yom ne +n M((E1 + +++ + Sn)" | A), 


(6c) M((Er-+ ++ +8, 2/4) =M(Er+-- +624) = — : (r=k=m). 


r 


In verifying the inequality (6c), one has to use the fact that according 
to the definition of the event A, the random variables & (k>~r) are mutually 
independent of each other also under the condition A,, further that they 
are independent also under the condition A, of the variables &,&,...,&-. 
It should be mentioned that the same fact is utilised in the proof of (1) due 
to KOLMOGOROV [1]. 


REMARK 1. If we choose n—1 and c,==c.—=-:-—Cc,—1, we obtain 


from (2) as a special case the inequality (1). If we choose c, — 


(k—n,n-+-1,...,m), we obtain the inequality 


i bod | >” Di. m " 
(7) P| max [sit Set +: +5 Ja2(@ a > | 
k => = 5) . 


= 5D 2 — 2 
NEk=m é we k—=n+1 k 


REMARK 2. By means of passing to the limit m— ov, it is easy to 
deduce from (2) the following inequality: 


@ 


(8) P(sup Cr [Er + + +6&,| = és aC Ch >, D; = Zz, Ci ‘Di. 


k=n+1 


Especially, if c;, =+ (k= 1, 2,...), we obtain the inequality 


> DS oes. 

share sob Si J= 1 (2 : <; Di 

9 P| su ~ > 2 Spe k=1 “XN k 
(9) Sup | ana anes oak 


' If r—-n, only the second inequality is supposed. 
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REMARK 3. It follows from (9) immediately, that the strong law of large 
numbers holds for the sequence of mutually independent random variables 


&.,5,...,&,... if the §&’s have mean values 0, finite variances D;— M(E&) 
and 

© 2 
(10) Se 

k=1 ke 


converges ([2]). 
As a matter of fact, it follows from (9) and (10) that for any «>0 


(11) lim P [ sup Es ee Sk 5 : ay, 


nu->O nSk k 


and therefore we have 


(12) P| lim : 
(Received 25 July 1955) 
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OBOBLUIEHME OJHOPO HEPABEHCTBA A. H. KOJIMOFOPOBA 
A. Xaex (Mpara) u A. Pexbnu (Byganewr) 


(P e310 Me) 


B paOote foKaseiBaeTCA Ciefyroulee HepaBeHCTRO: 
Myctb &,&,...,§ H@3aBMCHMbIe CIy4aHbIe BEWYHHbI, MATCMATHYCCKUE OVKHAHHA 


Lyre om 
KOTOpbIX paBHEt Hymo (M(&,)=—0; k= 1,2,...,m), a aAncnepcun KoHeynn (D'(;,) = Dj; 
k=1,2,..., m); mycTb, famee, C, HE BOSPAaCTaOWIaA NMOCIEAOBATEABHOCTh NOAOKUTETb~ 
HBIX 4nNCen. Torga ecan 1<n=<™m u e« > O, uMeem 
e ! ~ a 1 Vs ~~ 2 ! > 2 2 
(2) P( max cx| §1 +---+§(DSas 4 Korte, D; = ee, ce Dale 
nSkSm oo Gaia k=4+1 ; 
Ecau n—1 un c,=1, TO B KayecTBe YaCTHOrO CAy4ad MOAyYaeM XOPOWIO USBeCTHOE HEepa- 
penctso (1) A. H. Koamoroposa. Bocnonpsosapuinch HepareHcTBOM (2), MOKHO 


ynpocTutTb JOKa3aTeIbCTBO YCHJICHHbIX 3aKOHOB OombuINx 4NCeN. 


ON A NEW AXIOMATIC THEORY OF PROBABILITY 


By 
ALFRED RENYI (Budapest), corresponding member of the Academy 


Dedicated to Professors L. Fryér and F. Riesz on their 75th birthday 


Introduction 


The axiomatic foundation of probability theory given by A. N. KoLmo- 
GOROV [1] in the year 1933 has been the starting point of a new and bril- 
liant period in the development of probability theory. According to this theory 
to every situation (experiment, observation etc.) in which chance plays a 
role, there corresponds a probability space [S, A, P], i. e. an abstract space 
S (the space of elementary events), a o-algebra © (the set of events) of 
subsets of S, and a measure P(A) (the probability of the event A) defined 
for A€d and satisfying P(S)—1. The theory of KOLMOGOROV furnished an 
appropriate and mathematically exact basis for the rapid development of 
probability theory, which took place in the last 30 years, as well as for its 
fruitfull application in a great number of branches of science, including other 
chapters of mathematics too. Nevertheless in the course of development there 
arose some problems concerning probability which can not be fitted into the 
frames of the theory of KOLMOGOROV. 

The common feature of these problems is that in them wnabounded meas- 
ures occur, while in the theory of KOLMOGOROV probability is a bounded 
measure normed by the condition P(S)=1. Unbounded measures occur in 
statistical mechanics, quantum mechanics, in some problems of mathematical 
statistics (for example in connection with the application of the theorem of 
Bayes) as limiting distributions of Markov chains and Markov processes, in 
integral geometry, in connection with the applications of probability concepts 
in number theory etc. 

In the theory of KOLMOGOROV it has, for instance, no sense to speak 
about a probability distribution which is uniform on the whole real axis or 
on the whole plane, further it has no sense to say that we choose an integer 
in such a way that al integers (or all non-negative integers) are equiprobable. 

At the first glance it seems that unbounded measures can play no role 
in n probability theory, because, in view of the connection between probability 
and relative frequency, probability clearly can not take any value greater than 1. 
But if we observe more attentively how unbounded measures are really 
used in all cases mentioned above, we see that unbounded measures are 
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used only to calculate conditional probabilities as the quotient of the values 
of the unbounded measure of two sets (the first being contained in the 
second) and in this way reasonable values (not exceeding 1) are obtained. 
This is the reason why unbounded measures can be used with success in 
calculating (conditional) probabilities. But as the use of unbounded measures. 
can not be justified in the theory of KoLmMoGoRov, the necessity arises to 
generalize this theory. In the present paper such an attempt is made. 

Clearly in a theory in which unbounded measures are allowed, condi- 
tional probability must be taken as the fundamental concept. This is natural 
also from an other point of view. In fact, the probability of an event depends. 
essentially on the circumstances under which the event possibly occurs, and 
it is a commonplace to say that in reality every probability is conditional. 

This has been realized by several authors; | mention here without aiming 
at completeness only H. JEFFREYS [2], H. REICHENBACH [3], J. KEYNES [4],. 
R. Koopman [5], A. COPELAND [6], G. A. BARNARD [7] and I. J. Goon [8]. 

But none of the mentioned authors developed his theory on a measure- 
theoretic basic. The axiomatic theory developed in the present paper com- 
bines the measure-theoretic treatment of KOLMOGOROV with the idea proposed 
by the authors mentioned (and also by others) to consider conditional proba- 
bility as the fundamental concept. 

The novelty of the theory lies only in this combination. It follows from 
what has been said that in developing the theory proposed in this paper we 
follow the same way as KOLMOGOROV, only we try to go one step further. 
Thus, this new theory should be considered as a generalization of that of 
KOLMOGOROV. In fact, it contains the theory of KOLMOGOROV as a special 
case, but includes also cases which can not be fitted into the theory of 
KOLMOGOROV, namely cases in which conditional probabilities are calculated 
by means of unbounded measures. 

Among the authors mentioned above only H. JEFFREYS uses explicitely 
unbounded probability distributions (especially random variables & for which 
log is uniformly distributed on the whole real axis) but he does not give 
an exact mathematical meaning to such distributions, and restricts himself to 
the remark that it is a mere convention that to a certain event there corres- 
ponds the probability 1; he says that in some cases instead of 1 the value 
-+ ce can also be taken. 

The attempt to extend the scope of the mathematical theory of proba- 
bility with the aim to give a well founded basis for such calculating proce- 
dures which were successfully used in many fields of applications without 
being mathematically rigorously justified, has many analogues in the history 
of mathematics. I mention only, as one of the latest such successful attempts, 
that of S.L. SOBOLEV and L. SCHWARTZ, concerning the generalization of the 
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notion of a function, to include, for instance, the function of Dirac, together 
with its derivatives etc.’ 

The theory as presented in this paper is still far from being fully devel- 
oped; we restrict ourselves to give here only the axioms and their immediate 
consequences (§ 1), further to discuss some examples (§ 2) and applications 
(§ 3), and finally to develop some “conditional” laws of large numbers (§ 4). 
As an application of the conditional strong law of large numbers, a generali- 
zation of BOREL’s theorem on normal decimals for CANTOR’s series is given. 

I hope to return to the questions left unsolved in a forthcoming publication. 

I had the occasion to lecture on the present theory in 1954 at several 
congresses: in Budapest [9] at the General Assembly of the Hungarian Aca- 
demy in May 1954, at the Conference on probability and statistics in Prague 
in June 1954, at the International Congress in Amsterdam [10] in September 
1954, at the Conference on probability and statistics in Berlin [11] in October 
1954 and at the Conference on stochastic processes in Wroctaw in December 
1954. At these (and other) occasions many valuable remarks have been made. 
I mention only the following ones: B. V. GNEDENKO kindly informed me in 
Prague in June 1954 that in a lecture held some years ago in Moscow A. N. 
KOLMOGOROV himself has put forward the idea to develop his theory in 
such a manner that conditional probability should be taken as the funda- 
mental concept, but he never published his ideas regarding this question. 
I was glad to learn from this information that my attempt, besides of being 
a continuation of the work of KOLMOGOROV, follows the lines which have 
been pointed out by himself. In § 3 an inequality of J. HAJEK is used which 
he communicated to me in Prague in June 1954. A proof of this inequality 
is published in a joint paper of the author and J. HAjek [12] in this volume. 
Some interesting measure-theoretic problems, which arose in connection with 
the present paper, have been solved by A. CsAszArR: his results, which he 


1 The Dirac 6-“function” and the uniform distribution on the whole real axis (or the 
whole space etc.) arise in the same way in quantum mechanics and they are in a certain 
sense dual to each other. As a matter of fact, it is easy to verify the following fact connected 
with Heisenberg’s uncertainty relation (for the sake of simplicity we restrict ourselves to 
the one dimensional case): if the wave function (x) of the position of a particle degener- 
ates into a Dirac 6-“function”, the wave function y(p) of the impulse of the particle degen- 
erates into a function for which |y(p)|2= const. is the “density” of a “uniform proba- 
bility distribution in the whole phase space”. This can be shown as follows: as it is known, 
denoting by (p) the wave function of the position and by p(p) the wave function of the 

+0 Upx 


impulse of a particle, we have LON | w(xye ’ dx. This formula shows that if 
eA A 
—@ 
ipxe 


w(x) degenerates into the Dirac function 6(x—xX)), we have ¢(p)= net for 
which |p(p) |? const. 
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exposed at the first time as comments to my lecture [9], are published in his. 
paper [13] in this volume and settle the question under what conditions 
can the conditional probability, introduced in the present paper as a set 
function of two set variables, be expressed in quotient form by means. 
of (one or more) set functions of one variable. D. vAN DANTZzIG called my 
attention to the work of KEYNES, COPELAND and KOOPMAN. Ju. V. LINNIK 
called my attention to a paper of J. NEYMAN [14], where the foundations of 
the theory of probability are sketched in a form which has some points of 
contact with the point of view of the present paper. In Berlin A. N. KOLMOGOROV 
called my attention to those conditional probability spaces which I call “Cavalieri 
spaces” (§ 2). I hope to return to the thorough investigation of such spaces ina 
forthcoming paper. I owe to a discussion with E. MARCZEWSKI Theorem 14 of § 2.. 
The result of 3.5 has been suggested to the author by a remark of K. SARKADI. 
A. CsAszAR and J. CzipszeR kindly read the manuscript of the present paper’ 
and made some valuable remarks which [| have utilized in preparing the 
final form of this paper. 

I am thankful to all those mentioned for their remarks and suggestions.. 


§ 1. The axioms and their immediate consequences 


1.1. Notations. In what follows if A and B are sets, we denote by 
A-+B the sum of the sets A and B (i. e. the set of those elements which 
belong at least to one of the sets A and 6); AB denotes the product of the 
sets A and B (i.e. the set of those elements which belong to both of the sets. 
A and 6); to denote the sum resp. the product of a finite or infinite family 
of sets, we use also the notation SY resp. //. The empty set will be denoted 
by O; ASB expresses the fact that A is a subset of B; the subset of B 
consisting of those elements of B which do not belong to A will be denoted 
by B—A. If a is an element of the set A, this will be denoted by a€ A. 
If a does not belong to the set A, this will be denoted by ag A. 


I. 2. Definitions and axioms. Let us be given an arbitrary set S; the ele-- 
ments of S which will be denoted by small letters a,b,... will be called 
elementary events. Let (| denote a o-algebra of subsets of S; the subsets of 
S which are elements of @ will be denoted by capital letters A,B,C,... 
and called random events, or simply events. [The supposition that G is a 
o-algebra means (see [15], p. 28) that 1. if A, € 4 (n= 1,2,...), we have 
> A, Ed; 2. if AEA, we have S—A€d; 3. A is not empty. This implies 


that O€ A and S€a.] Let us suppose further that a non empty subset 2. 
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of A is given; we do not suppose any restrictions regarding the set ob.° We 
Suppose finally that a set function P(A|B) of two set variables is defined for 
Aé€d and BE &; P(A|B) will be called the conditional probability of the 
event A with respect to the event B. As the conditional probability of the 
event A€Cl with respect to the event B is defined if and only if B belongs 
to 3b, 3% may be called the set of possible conditions. We suppose that the 
set function P(A|B) satisfies the following axioms: 


Axiom I. P(A|B)=0, if A€A and BES; further PUB bye ts if 
Be &. 

Axiom IL. For any fixed B€ 8, P(A|B) is a measure, i.e. a countably 
additive set function of ACA, i.e. if A,EA (n=1,2,...) and A;A,—=O 
mapa -k (j,k—1,.2,...), we have 


P{ Sa, 8) => Prop). 
Jat =a ees n=l 


Axiom Ill? Jf A€d, BEd, CER, and BCE &, we have 
P(A BC). P(6\€)=P(AB|C). 


If the Axioms I—III are satisfied, we shall call the set S, together with 
the o-algebra (1 of subsets of S, the subset 38 of and the set function 
P(A|B) defined for A€ A, B € 8, a conditional probability space and denote 
it for the sake of brevity by [S, A, 3%, P(A|B)]. 


1.3. Connection with Kolmogorov’s theory. If P(A) is a measure (i. e. 
a countably additive and non-negative set function) defined on the 
o-algebra Q of subsets of the set S, if further P(S)—1, then the triple 
[S, A, P(A)] is called a probability space in the sense of KOLMOGOROV, and 


if we define * as the set of those sets BéA for which P(B)>0 and put 
(A|B)— pay for AE d, Be A’, clearly [S, 4, O*, P(A|B)] is a condi- 
tional probability space which will be called the conditional probability space 
generated by the probability space [S, 4, P(A)]. 

Conversely, if [S, 1, <8, P(A|B)] is a conditional probability space and 
C is an arbitrary element of 3%, putting Pco(A)=P(A|C), [S, A, Po(A)] will 
be a probability space in the sense of KOLMOGOROV. Thus a conditional pro- 
bability space is nothing else than a set of ordinary probability spaces which 


2 It will be seen that our axioms imply that O € 3B, but it is possible that ¢3 con- 
tains all elements of @ except ©; on the other hand, it is possible that & contains 
only one set. The theory is somewhat less general, but considerably simpler if it is sup- 
posed that Q is an additive class of sets, i. e. if from BEB and B,€ # it follows 
B, + B.€ S. Concerning the consequences of this supposition see [13]. 

8 See 1.7 where an equivalent axiom (Axiom III’) is discussed, and 1.8 where a 


stronger form of this axiom is mentioned. 
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are connected with each other by Axiom III. This connection is such that it 

is in conformity with the usual definition of conditional probability. Namely, 

if we put Pc(A)—=P(A|C) for AEA with CE & fixed, and define the con- 

ditional probability P*(A|B) for a Bé 8 for which Pc(B)>0, as usual in 
P-(AB) 


the theory of KOLMOGOROV, by EP) pane we have by Axiom III 
P*(A|B) — peg cy” ~ PAIBO). In case S€&, clearly [S, d, Ps(A)] is a 


probability space in the sense of KOLMOGORov. It must be mentioned that in 
this case [S, 4, 8, P(A|B)] may not be identical with the conditional proba- 
bility space generated by [S, A, Ps(A)] because 3 may contain sets B for 
which P(B|S)=0 and at the same time need not contain every set B for 
which P(B|S)>0, i. e. the system Ss consisting of all sets 6 € 4 for which 
P(B|S)>0O need not be identical with 3. However, if P*(A|B) is defined 


by P*(A|B) = “Say for B € Sx, we have P*(A!B) — P(A|B), provided 
that BE S. 

1.4. Immediate consequences of the axioms. We shall prove some simple 
theorems which follow from our axioms. In what follows if P(A|8) occurs, 
it is always tacitly assumed that A€ GQ and BE &. We denote the set S—A 
by A. 

THEOREM 1. P(A|B) = P(AB|B). 

Proor. If in Axiom III C—B, we have P(A|B)P(B|B)—P(AB|B). 
Taking Axiom I into account Theorem 1 follows. 

REMARK. It follows from Theorem 1 that P(S|B)—1; namely, by Theo- 
rem 1 P(S|6)— P(SB|B)—P(B|B) and thus, by Axiom I, P(S|B)—1. 

THEOREM 2. P(A|B) = 1. 

Proor. According to Axiom II we have P(AB|B)-+-P(AB|B) = P(B|B). 
As by Axiom | P(B|B)—1 and P(AB|B) = 0, it follows P(AB|B) =1 and: 
thus by Theorem 1 we obtain P(A|B) = 1. 

THEOREM 3. P(O|B)=—0. 

PRooF. According to Axiom II P(O|B) = P(O+ O|B) = 2P(O}|8) and 
thus P(O|B)=—0. 


REMARK 1. It follows from Theorem 3 that O€s&, because if O would 
belong to sb, we should have P(O|O)—1 by Axiom I and P(O|0) =a 
by Theorem 3; thus the assumption O € & leads to a contradiction. 


REMARK 2. It follows from Theorem 1 and 3 that if AB=O, then 
P(A|B)=—0. 
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THEOREM 4. P(A|BC)P(B|C) =P(B\AC) P(A|C). 
PRroor. By Axiom III both expressions are equal to P(ABC) and thus 
to each other. 
THEOREM 5. Jf AC A’CBCB’ we have 
P(A|B’) = P(4’|B). 

PrRoor. We have 

P(A|B’) = P(AA’B|B’) = P(AA’|BB)P(B|8’) = 

= P(AA’|B) — P(4'|B)—P(AA’|B) = P(A’). 


REMARK 1. If AA’, we obtain the following special case of Theo- 


REMARK 2. If B— 8B’, we obtain the following special case of Theo- 
rem 5: if ACA’, we have (without supposing that A’C B) P(A|B) = P(A’|B).' 
As a matter of fact, P(A|B) — P(AB|B) and P(A’| B) = P(A’B|B) by Theorem 
1; if ACA’, we have ABCA’BCB, and Theorem 5 can be applied.’ 


THEOREM 6. /f A,+-A,— B,B, € &, further P(A,| B,) P(A,|B.) > 0, we have 
P(A,|B,) — P(A,|B,) 


P(A,|B,) — P(A,|B,) ° 
Proor. According to Axiom III 


(1) P-(A;| B, B;) P(B,| B,) = P(A, B,|B:) = P(A,| Bs) 
and similarly 
& {2) P(A,|B, B.) P(B,| B,) = P(A2B, | B,) = P(Ay| B:). 


Dividing (1) by (2) we obtain 
P(A,| B,B,) _ P(A) Bs) 
(8) P(A,|B,B.)  P(A,'B.) ° 


Interchanging B, and B, in (3) we obtain 


5s) P(A,/B.B.) P(A. B,) 
Comparing (3) with (4), Theorem 6 follows. 

THEOREM 7. /f C2 B= >, B, and AB;B,C=O for f+: (j,k=1, 2, ...), 

a1 
we have “ 
P(A|C) = > P(A4|B.C) P(B:|C). 
Kk=1 

4 It should be mentioned that this special case of Theorem 5 follows from Axioms 

1 and Il; Axiom III is not needed. 


5 Acta Mathematica V1/3—4 
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Proor. By Axiom III] P(A|B: C)P(B.|C) = P(AB,|C) and ‘thus by 
Axiom II and applying Theorem 1 twice, it follows 


> P(A|B.C) (BIC) - > PAB IC)= P(AB|C)=P(ABC|C)= 


_P(AC|C)- P(A|C). 
REMARK. We mention the following consequences of Theorem 7: Let 


us suppose B, € ® and B;B,—O for j=-k, B= 2B and Be; if 


P(A|B,) =4P(A'|B,) for k==1,2,... where 4 =0, we have P(A|B)= 
= 1P(A’|B). 

Especially if P(A|B.) —AP(A’|Bx) for k= 1, 2,..., we have P(A|B) = 
—{P(A’|B), further if P(A|B,) 4 for k=1, 2,..., we have P(A|B)=A4. 


Proor. Applying Theorem 7 twice with C—B we obtain 
P(A|B) — > P(A|B,) P(B:|B) = 2 > P(4’|B,) P(B;|B) = 2P(A4’ |B). 
k=1 me ae! 


The two other assertions are evident consequences. 


1.5. Representation of the conditional probability as a quotient. We 
shall give a sufficient condition under which the set function P(A|B) of two 
set variables can be represented in “quotient form’, i. e. in the form 
P(AIB) =a where the set function Q(A) is a measure on O and 
satisfies Q(B) >0 if BER. 

THEOREM 8. Let [S, O, %, P(A|B)] be a conditional Wee space. — 
Let us suppose that there exists a sequence of sets B,(n=0,1,...) for which 
the following properties hold: 

a) BroaS& Buss (n=0,1,...), 

b) P(B,|B,) >0 (ial he a), 

c) For any Bé& there can be found a B, for which BCB, and 
P(B|B,) > 0. ; 

Then there exists a finite measure Q(C) defined for C eat where Q* 
is the ring of those sets CEA for which there can be found a B, with 
CCB,, and this measure Q(C) has the following properties : 

«) Q(B)>0 if BES; 

; Q(AB) 

P(A|B ; 

#) P(AIB) = “are 

If the sequence B,, Satisfies besides a), b), c) also the following con- 
dition : 

Oye ie ( By) 5,) > 0, 
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then Q(C) can be defined for all CEA and is a bounded measure on a, 
and thus, putting P(C) - as we have P(S)=1. Denoting by 8%* the set 
of those sets BE A for which P(B)>0, if &* is not identical with BD, we 
may extend the definition P(A|B) to all B€ &* putting 
podigh dene 
the conditional probability space [S, A, &*,P(A|B)] obtained in this way will 
be identical with the conditional probability space generated by the ordinary 
probability space [S, a, P(A)]. 

Proor. First we suppose only that the sequence B, has the properties 
a), b) and c). Clearly Q* is a ring and we have 8CQ*C@. Let us con- 
sider a set A€ Cl", choose an index n for which ACB, and define Q(A) as 
follows: 

P(A|B,) 

(5) Q(A) — P(BIB,) 
It is clear that the value of Q(A) does not depend on the choice of n. As 
a matter of fact, if ACB, and ACB, where n<m, we have by Theorem 6 


P(A'B,) ___P(A|Bn) 
PUR) P(B,| Bn) : 
Now, if B€ &, Q(B) > 0, we have 


Q(AB 
(6) P(A|B)—— a 


This can be shown as follows: if BCB, and P(B|B,)>0, we have 


Q(AB) _ P(AB|B,) P(8|B.)_. P(AB|B,) 
Q(B) —s_—-séP(BB,) PBB) = PBIB) © 
Applying Axiom III we obtain 


So oe P(A|BB 
Q(5) | ) 
As BB, = B, (6) is proved. 
From (5) it can be seen that Q(A) is non-negative. To show that © (A) 
is a measure, we have to prove that Q(A) is countably additive on Chante: 


1A. (k=1,2,...). and A;Ag=© for j=+k and a A= Aa, then 


. F 
== i hat if ACB,, we 
Q A Q Ax). This follows simply from the remark t c ’ 


have A,CB, for 1,2,... and thus in the relations 
| P(A/B,) 
P(A Bas penta 35 Omer. 
OY Easy erg yy es ee P(B,|B,) 


5 
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the same B, may be used, and therefore the countable additivity of Q(4) 
follows from that of P(A|B) for fixed B¢€ & (Axiom I). 

Thus the first part of Theorem 8 is proved. Now we suppose that the 
sequence B, has besides a)—c) also the property d). By a well-known the- 
orem (see p.e. [15], § 13, Theorem A) the definition of Q(A) can be extended 
to the smallest o-ring O** containing CG” in such a manner that Q(A) 
remains countably additive on **. Let us put S*— ss B,; we shall show 


) 


that Q** is identical with the o-algebra (S*, i.e. with the set of all sets of 
the form AS* where A€ C4. As a matter of fact, A*CAS* and QS* is a o- 
ring, thus we have clearly A CQS*. On the other hand, if AC, we have 


AS*= > AB,. 


Now AB, C8B,, and thus AB, €4*, and therefore AS*€a™; thus 
AS*Ca* which implies GS*=a™. Thus the definition of Q(A) can be 
extended to all A€QS*. We prove now that Q(A) is bounded on QS*, 
To show this it is sufficient to prove that Q(S) is finite. But S*— lim B, 


1i—> C 


and B,CB,.1, and thus Q(S*)= lim Q(B,,) where Q(B.) is non-decreasing. 


On the other hand, 
P(B,|B,) 1 
Q(B.) = P(BIB,) P(BIB) ” 

Thus e) implies that Q(S*)<-+-~. Defining Q(A) by Q(A)= Q(AS*) for 
Aéd, AGAS", the definition of Q(A) is extended to the whole o-algebra A. 
The final part of Theorem 8 concerning P(A) is obvious. Thus Theorem 8 
is proved. 

A necessary and sufficient condition for the existence of the quotient 
representation P(A) B) ae is contained in the paper [13] of A. CsAszAr. 

1.6. Random variables on a conditional probability space. Let [S, A, 8, 
P(A\B)] be a conditional probability space. If = &(a) denotes a real-valued 
function defined for a€S which is measurable with respect to A, i.e. if A, 
denotes the set of those a€S for which &(a) Sts we have A, € @ for all 
real x, we shall call § a random variable on [S, A, &, P(A! B)]. Vector-valued 
random variables are ‘defined similarly. The fardasen conditional probability 
distribution function of a random variable & with beepeel to an sao BES 
is defined by F(x|B)— P(A,|B); if F(x|B) is 
—f(x|B) is called the (ordinary) conditional probability density func of 
with respect to B. The conditional mean value M(&|B) of € with respect to 
an event BES is defined as the abstract Lebesgue integral 


M(&|B) — | £(a)dP(A|B) 
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of § with respect to the measure defined on S by P(A|B) with B fixed. 
Higher conditional moments, the conditional characteristic function etc. are 
defined similarly. The random variables § and 7 are called independent with 
respect to an event C, if denoting by A, the set of those a€S for which 
E(a@)<x and by B, the set of those a@€S for which 7(a)<y, we have 
P(A,B,|C)—P(A,|C)P(B,|C) for every real x and y. 

As [S, A, P(A|B)] is for any fixed B € 8 a probability field in the sense 
of the theory of KoLMoGoRov, any theorem of ordinary probability theory 
remains valid when ordinary probabilities, distributions, mean values, inde- 
pendence etc. are replaced by conditional probabilities, conditional distribu- 
tions, conditional mean values, conditional independence etc. with respect to 
the same 6 € s8. Problems which are peculiar to the theory presented in this 
paper are those in which conditional probabilities with respect to different 
conditions are figuring. We shall see in § 3 some examples of such problems, 

Let us mention that if § is a random variable, and A’ denotes the set 
consisting of those elements a €S for which « = &(a) <9, and if A? €& for 
a set X of intervals (¢, 2), then the conditional probabilities P(A%|A%) can 
be considered for («, *)€ X and thus § generates a conditional probability 
space on the real axis %, as the space of elementary events, the o-algebra 
& being the set of Borel subsets of R and & consisting of the intervals 
(@, BEX. 

This conditional probability space will be called the conditional proba- 
bility distribution generated by § on the real axis. 

Let F(x) denote a non-decreasing function of x which is continuous to 
the left for —~o<x<-+oo. If the set Af belongs to & whenever 
F(8)— F(a) >0, and we have for any subinterval (x,y) of such an interval 


(a, @) 
y EQ) FQ) 
(Ta) P(A As) = F(3) Fe) ’ 


we shall call F(x) the generalized distribution function” of §; the function 
F(x) is not uniquely determined, as together with F(x) G(x)—cF(x)+d 
where c >0 is also a distribution function of §; but as F(x) will be used 
only to calculate the conditional probabilities (7a), this will never lead to a 
misunderstanding. If the distribution function F(x) of 5 is absolutely conti- 
nuous, and F’(x)——f(x), we shall call f(x) the generalized density function 
of €; clearly f(x) is determined only up to a positive constant factor. If 
F(x) =x (i. e. f(x) 1) for — <x< + ~~, we shall say that the distribu- 
tion of — is uniform in (—-~, +). 


5 Conditions ensuring the existence of a generalized distribution function of a ran- 
dom variable £ can be formulated by using the results of the paper jis}. 
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If f(x) is the generalized density function of € we have 


\Aadu 


(7b) P(At| 4c) =-,— 
| f(u)du 


The generalized distribution function resp. density function of a random vector 
is defined similarly. 


1.7. An alternative form of Axiom I/II. We have already pointed out 
that our system of axioms can be characterised in the following manner: the 
set S, the o-algebra of subsets of S, the subset 38 of and the set func- 
tion of two set variables P(A|B) defined for A€ A and BE & form a con- 
ditional probability space if %,—[S,,P(A/6)] is an ordinary probability 
space for every fixed Bé€S& and if the probability spaces Sy and Xzc are 
connected by Axiom II! if C€ ® and BC€ SX. Thus different probability fields 
can be combined to form a conditional probability field only if they are 
“compatible” in that sense that they satisfy Axiom III which can be consid- 
ered as the condition of compatibility. 

Now it is easy to prove 


THEOREM 9. Axiom III can be brought to the following equivalent form: 


Axiom Ill’. Jf BE 8, CE, B=C and P(B\C)>0, we have for any 
A€d 
P(AB\C) 
P(BIC)~ 

Proor. Clearly Axiom III’ is a special case of Axiom III. Conversely, if 
Axiom III’ is valid, Axiom II follows. This can be shown as follows: if 
Ae d, BEA, CER and BCE &, two cases are possible: either P(B|C) —0 
or P(Bi|C)>0. In the first case we have also’ P(AB|C)=—0O and thus 
P(A|BC)P(B\C)—P(AB|C) reduces to 0—0. Now let us suppose 
P(B|C) > 0. It is easy to see that Theorem 1 follows already from Axioms 
I—III’, and thus it can be applied in the present proof. But this means that 
P(BC|C)=-P(B|C)>0 and thus the conditions of Axiom III’ are satisfied 
with BC instead of B, and it follows from Axiom HI’ 


(8) P(A|BC)P(BC|C) =P(ABC|C). 
As P(BC|C) = P(B|C) and P(ABC,|C)—P(AB|C), it follows from (8) 
P(A|BC)P(B|C) = P(AB\C). 


Thus Axiom II follows from Axiom III’. 


P(A|B) — 


‘ See the footnote + to Remark 2 to Theorem 5. 
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REMARK. Theorem 9 means that Axiom III contains a compatibility con- 
dition for 8; and 8~ where BCC if and only if P(B|C) +0; if PGi Cjze0) 
8 and Sy are compatible without any restriction. This fact is the basis of a 
general principle by use of which conditional probability spaces can be con- 
structed. This principle is expressed in Theorem 14 of § 2. 


1. 8. Extensions of a conditional probability space. If [S, 4, &, P(A|B)} 
is a conditional probability space, it is natural to ask how could this space 
be extended, by including into & sets A€ 4 which are not contained in 3. 
The most simple way is suggested by Axiom III, and is contained in the 
following — 


THEOREM 10. Let B, denote a set for which B,€ Q and B,¢ &. If there 
exists at least one set B, with the following three properties: «¢) B,€ &, 
6) B,SB,, y) P(B,|B,)>0, further if for any other set B, which also has 
the properties a), 8), y), we have B,B,€ &, the definition of P(A'B) can be 
extended for B= B, by putting 
P(AB,|B:) 

P(B,| By) © 

Proor. If P(A|B,) is defined by (9), Axioms I and II are clearly satis- 
fied, therefore we have to verify only Axiom III. Three cases must be dis- 
tinguished. a) If we put B,C’ and B’ is a set for which B’C’€R, we 
must verify 


(9) P(A|B,)- 


P(A(B'C)P(B'C’)=P(AB IC’). 
But this means by (9) 
P(A|B, B’)P(B, B’| B,) = P(AB,B’| B,) 
what is true by force of Axiom III, in view of B,B’=B’C’¢ & and B,€ 8. 
b) If B, = B’C’ where C’ € &, we must verify P(A|B,)P(B’|C’) — P(AB’C’). 
But this means by (9) 
P(B’|C’)P(AB,| B.) = P(AB’|C’)P(B,| B:) 
what reduces to 00 if P(B’|C’)—0 and to 
P(AB,|B,) _ P(AB’|C’) 
PBIB) PBC) 
if P(B’\C’)>0. But as B,—=B'C’, by applying Theorem 1 to both condi- 
tional probabilities on the right of (10) we find that (10) is equivalent, to 
7 P(AB,|B.) _ P(AB,|C’) 
wy P(B |B) — P(BIC) 
But (11) follows from Theorem 6, taking into account that 
AB, +B8,=B,SB, and ABE BSB BSL, 
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and that clearly P(B,|C’)—=P(B’\C’) > 0 and thus C’ has the properties @), 
°) and y) and therefore B,C'€ &. 

lf B’'C’=B, and C’=B, where BEd, we have to verify 
P(A|B’C’)P(B’|C’) = P(AB’'|C’). As P(AB’|C’)=P(AB'C’|C’), this rela- 
tion is trivially equivalent to P(A|B,)—P(AB,|B,), which is satisfied by 
force of (9). 

It is easy to see that the definition of P(A|B,) does not depend on the 
choice of B,; as a matter of fact, if both B, and B, have properties «), §) 
and +), it follows by Theorem 6 that 


P(AB,|B,) _ P(AB,|B;) 


~P(B|B) = P(B,| Bs) ~ 
It is also clear that P(AB,|B;) can not be defined otherwise as by (9) be- 
cause if B, is included into 3%, (9) must hold by force of Axiom III. 
Another possibility for including new sets into sb is yielded by passing 
to the limit; this procedure is described by the following 


THEOREM 11. Let us suppose that B,€ 3, B,SBiaa, further 


P(B,|Bus)>O (n=0,1,...) and that [fP(B,|Bis) converges. If 


ao 


Bo =>, B, does not belong to &, the definition of P(A\B) can be extended 


n==0 


for B=B., by putting 
(12) P(A|B.)=lim P(A|B,) for any AE, 


provided that the following condition is satisfied: if Be and P(B\By)>0O 
for some N, we have BBy € &. 

Proof. For an arbitrary A€Qd we put A®—AB,, A®— AB Bry 
(k= 1,2,...). As AMCB, for n= k, the sequence P(A” |B,,) is by Theorem 
5, Remark 1 monotonically decreasing for n—k,k-+-1,... and thus 

lim P(A®|B,) = P(A®|B.) 


exists. 
Putting 


(13) P*(A|Ba) = > P(A®| Ba) 


we have defined P*(A|B.) for every A€ Gd. To prove Theorem 11, we have 
to show that if P*(A|B..) is defined by (13), Axioms I—III remain valid, 
further that lim P(A|B,) P(A|B.) exists for all A€Q and P(A|B,) = 


ei Pb gatd Ian e. that (12) and (13) are equivalent. As regards Axiom I, it 
is clear that P"(A B.) = 0; the validity of P*(B.|B.)—1 can be shown as 
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follows: if A — Be. AY) — Be and Aw 2 BB: : (k = fe 23 i 4 which implies. 


P*(Ba|Bo)=P(B,|Ba)-4 SPB, :|Bo) = lim P(By| Ba). 
N>o 
But 


nt ms 
P(By|B.)—lim P(By|B,) = lim [f P(B,! Bi) = [J P(B.\B,.1) 
n> © n—->O k—=—N oA 
and thus 
P*(Bo|Bo)=lim Jf P(B,|Br1)=1 
N+>o k=N 


because the remainder-products of a convergent infinite product are always. 
tending to 1. Now let us verify Axiom II, i. e. that P*(A|B.) defined by 
(13) is countably additive. Let us suppose that A, € cl and A;A,—O, if 


o 


Pits, k—-1,2,-..), and An— >. A,. Let us put AP—A,B, and A= 


a1 
=—A,.B.B.. for k—1,2,..., further A®—A,B, and A® = A.B, By-1 for 
k--1,2,.... As for ACB, we have 


(14) P(A|Bo) =P(A|B;) LP (B,|B..) 


and P(A|B,) is countably additive, further A‘ — ES AS’ and AY-AY’ = © 


t=! 


for n= m, it follows 


(15) P(AY| Bo es SS ,P(An| Ba). 
But 3 
(16) P*(A~|Ba) = > P(As| Bo). 


From (15) and (16) it follows 

(17) P*(Aa|Bo) = 2 Sy {> PAP |B. y= 23 > SPB. ¥ 
As we have from (13) 

(18) S 2, P(An’| Bo) =P*(A,|B 

it follows from (16) beet (9) that 

(19) P*(Ao|Bo) = DPA, Ba), 


j-e. that P*(A|B..) is countably additive. 
Now we prove that 
(20) P*(A|Ba) = lim P(A] By) 
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for any A€Q. As a matter of fact, by (14) 


ae = 


P(A |Ba) 


> 


(Ql) P(A|By) = > P(A®|By) ss P(A” | By) =~. 
feta: LLP (B,| Buss) 


It follows from (21) that 
(22) lim P(A|By) = >, P(A®|Ba) 
. N>o@ k=0 
and thus, by (13), (20) follows. 
Now let us prove that Axiom III’ is valid. We distinguish three cases. 


The first case is when C€ 8, BoG&C and P(B.'C)>0; then we have 
P(By|C)>0 if N is sufficiently large and thus 


P(ABy\C 
(23) P(AIB) =p ICy 
Passing to the limit N— x in (23), and using (20), it follows that 
P(AB,|C 
(24) P(A|Bo)= ES 


The second case is when BEX, BOB, and P(B\B.)>0; we have to 
prove that 


P(AB Bz 
(25) P(A\B). “SATE .. 
If there exists an index N for which BC By, we have for sufficiently large N 
ae sey fy 
P(B)By) = P(A|B) 


and thus, passing to the limit N—, (25) follows. 

In the general case, let us consider the two measures «,(A) == P(A|B) 
and (A) = P(A|B.). Let A€ a denote an arbitrary set, for which AC ByB 
for some N. Then we have by Theorem 6, taking N_ sufficiently large, to 
ensure P(B|By) > 0. 

PBB PUae and thus (A) P(B|Ba),(A), 


taking into account that lim P(B|By)—P(B\B.)=-1 and thus P(B|By) >0 
N-> @ 


for sufficiently large N. Thus «,(A)== Cu,(A) where C=P(B|B.) does not 
depend on A if -A runs over all sets for which there exists an index N for 
which AC ByB. 

Clearly these sets A forma ring. As «.(A) and Cu,(A) are finite meas- 
ures, it follows that they coincide for the least o-ring which contains all 
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mentioned sets A. As B, — » By, it follows that «,(A) = Cu,(A) if AC BoB 
N=0 


and A€d. As BCB,, this means that U,(A). = Cu,(A) if ACB, i.e. we 
have proved that 


SAE net ra 
P(A|B) PBIB) he ares 
As ABCB for any A€a, this means that for any A€& we have 

a) _ P(AB|Bz) 
P(A|B) = P(AB|B) “P(BIBa) ” 

Thus (25) is proved. The third case is, when B—B, and C— Des ileus 

. wee (Abel oe oie ; 
case we have to prove that P(A|B.) P(B.|Bo) ° but this is evident 


because we have shown that P(B.|B.)=1 and by (15) P(AB.|Bao) = 
—P(A'B.). Thereby the proof of Theorem 11 is accomplished. 

REMARK. The assertion of Theorem 6 for the case A,+A,CB,B,, but 
without the supposition 6,5, € &, can be considered as a stronger form of 
Axiom III, it shall be called Axiom III*. 

Axiom Ill*. Jf A,EO, A, € a, B,€ 8% and B,€ &, further A,+-A,& B,B, 
and P(A,|B,)P(A,|B,) > 0, we have 

P(A |B) P(A|B:) 
P(A,|B;) P(A,| Bs) 

As Theorem 1 is not a consequence of Axiom III*, in case we replace 

Axiom III by Axiom III*, we must suppose the validity of Theorem 1 as 


Axiom III**, P(A|B)=P(AB|B) for AEA and BE 8. 
Axiom III* and Axiom III** together imply Axiom III’ and thus Axiom 
ml As a-~ matter of fact, choosing A,—=AB,A,—B,B,—=B8B and B,—=C 
where AE, BER, CER, BEC and P(B\C)>0, the conditions of Axiom 
IlI* are satisfied, and as by Axiom III** P(A|B)—P(AB5|B) it follows that 
Pete BA) Bb) PARC) 
P(4|5)——p(eisy — PIC) ”’ 


j.e. Axiom III’ is really a consequence of Axiom III* and Axiom III**. 

As Axiom HI and Axiom III’ are equivalent, Axiom III is also a con- 
sequence of Axiom III*. Conversely, Axiom III* does not follow from Axiom Ill, 
only in the special case when B,B,¢ st. If we would suppose Axioms III* 
and IIl** instead of Axiom III, the conditions of the extension theorems The- 
orem 10 and Theorem 11 could be reduced: in Theorem 10 the condition 
that for two sets B,,B, with properties @), #) and 7), By Bs € S&S could be 
omitted, in Theorem 11 the condition that if B¢ ot and P(|By)>0, then 
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BBx€& could be omitted. In what follows we do not suppose the validity 
of Axiom III*; it should be mentioned, however, that Axiom III* is contained 
as a special case in Axiom IV, introduced by A. CSASZAR [13]. 

lf § —[S, A, ®, P(A|B)] and 8” —[S’, a’, &’, P’(A|B)] are two such 
conditional probability spaces that S&S’, ACA’, ®RSR and P’(A|B)— 
—P(A|B) if A€A and BES, we shall say that the conditional probability 
space 3 is imbedded into the conditional probability space 3”. In the forego- 
ing section we considered only such special imbeddings of a conditionak 
probability space 3 into a conditional probability space 8” for which S’—S, 
A’ —A and SCR’. These imbeddings of % were obtained by extension of 
& in several manners. If 3 is imbedded into 8”, we shall write 3< &. 

1.9. Continuity properties of conditional probability. \t follows from 
Axiom II that P(A!B) is for fixed B€ & a bounded measure in A, and thus, 
of course, continuous in A, i.e. if A,€A and A,CA,4 (or A,2Ay) for 
n=1,2,..., we have for BES 
lim P(A, B) = P(lim A,,| B). 


u-> © 


As regards the continuity of P(A|B) as a function of B, we have 


@ 
“XN 
ol B, a 
n—) 


THEOREM 12. /f B,€ & and B,SBay (a=1, 2,...), further 
= BES, we have for AEA 
lim P(A|B,,) = P(A |B). 


n> ® 


Proor. We have by Axiom III 


P(AB,|B 
P(AIB) — "pGB,iB) 

if P(B,|B)>0. As lim P(B,|B) — P(B|B) 1, the last condition is satisfied 

for sufficiently large n, and thus 


lim P(A B,,| B) 


lim P(A/B,) === 


beet Ae EPA GIB} : 
te lim P(B,|B) — P(BIB) 


—P(A\B). 


Thus Theorem 12 is proved. 


The situation is somewhat more complicated if we consider a decreasing: 
sequence of conditions. In this case we have 


THEOREM 13. Jf Be &; BG, ER andseG-oCa, (n=1, 2,...). further iff 
putting C- I] C, we have BCE & and P(C|B)~0, it follows that 


lim P(A|BC,) — P(A|BC). 
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PRooF. We have by Axiom III 


P(A|BC,) = ee a if P(C,|B)~0 


As P(C,,|B) = P(C'B) > 0, the condition P(C,,|B) > 0 is satistied by every n 
and thus it follows 


lim P(AC,|B) 


as P(AC|B) 
lim P +28 weet (+) , 
ae er ae ling P(C,TBY P(C|B) UEC) 


what proves Theorem 13. 


1.10. Products of conditional probability spaces. The product of two 
conditional probability spaces (S®, 1, B”, P™)— Ss") (k—-1, 2) is defined 
as follows: let S=-S“xS@ denote the Cartesian product of the sets S® 
(k=1, 2), i.e. let S denote the set of all ordered pairs (a, a@) where 
AMES and a” ES, Let & denote the set of all subsets B,—=B,*B, of S 
where B,€ & and B,€ R°). Let denote the set of all subsets A= A,*A, 
where A,¢Q™ and A,€ a, and let & denote the least o-algebra containing 
@. Let us define P(A|B) for A=A,*A, and B=B,*B,, where A,€ A, 
A,EA?, BLE B” and B,€ R@) by 


P(A B) — P®(AM| BA) P®(A®) Be), 


-and let us extend the definition of P(A|B) for every fixed BE S& to all 
A€d in the usual way (see [15], § 13). Thus we obtain a conditional prob- 
ability space 9% —[S,d,&,P] which will be called the Cartesian product of 
the conditional Boao spaces #% and #©) and denoted by 9 = 9) x FO). 

The Cartesian product of a finite number of conditional probability 
spaces is defined similarly. The Cartesian product of a denumerable sequence 
of conditional probability spaces P — Oe Or he ND |= (de = 15:2 eae) 1S 
defined as follows: we denote by S== S;*---*S,*--- the Cartesian product 
oi the sets S® (k==1,2,...) by & the set of all sets B= B,*-:-*B,%--- 
miere 6, ¢ bo”  (n="1,2,...) and by < the set of all-sets A of the form 
A= A;* Aox---Anx S@Dx---, i. e. O is the set of all “cylinders” of S. 
We define P(A|B) for A€ A and BER, where A— A --- A, * SO") --- and 
5 =F; --- By, by 


P(A\B) — i P®(A,| Bi), 


_and extend the definition of P(A|B) in the usual way for any fixed Be 
‘to all sets A belonging to the least o-algebra a containing Cl. In this way 
we obtain a conditional probability space P —[S, 4, &, P(A|B)] which will 
be called the Cartesian Capes of the conditional probability spaces 9) 
and denoted by S=S0*---*Hx---, To prove that # is really a condi- 
tional probability space, we have oyily to verify the validity of Axiom III, 
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as Axioms I and II are clearly valid for §. As regards the validity of 
P(AB|B)=—P(A|B) (i. e. of Theorem 1) for 8, it suffices to prove that 


(26) P(A|BC) P(BC|C) =P(ABC|C) 
for AC, BEd, CEB and BCE S. | 

As both sides of (26) are measures as functions of A for fixed B and C, 
it suffices to a (26) for the case when A is a Siete A= A) % .-- 

x A” * S@).. 

In this case 

P(A|BC) — [] P®™(A|(BC)”). 
1 

Putting 


Py =] P%((BC)®|C®) 


the sequence Py is monotonically non-increasing, and thus uh Py p exists. 


Two cases are to be distinguished. If p—0O, we have P(BC|C)- O and 
thus P(ABC|C)=0 and therefore (26) is satisfied. If p >0, we have 


P(ABG IC) == T/P%(A% (BC) |C®) LP P©(BC)|C®) 
and 
P(BCIO\= 4 iT PH\((BC)|C), 


and thus 
P(A|BC) PBC\C)— [ [ PO(AY(BC)®)P%(BC)"|C®) [f PO(BCY\C%) | 


and thus, as P™ satisfies Axiom III, we have 
P(A |(BC))P® (BC) |C®) = P®(A(BC)|C®) 
and thus (26) is valid. 


§ 2. Examples of conditional probability spaces 


2.1. Conditional probability spaces of simple quotient type. An impor~ 
tant class of conditional probability spaces is obtained as follows: 

Let S denote a set, A a o-algebra of subsets of S, «(A) a measure on 
C1, & the set of those sets BEA for which «(B) is positive and finite and 
put P(A|B) — Oe for A€@, BES. Then [S, a, 8, P(A|B)] is a condi- 
tional probability space which will be called a “conditional probability space 
of simple quotient-type”. We mention two special cases. 
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a) Let us choose for S the n-dimensional Euclidean space £,, for A the 
‘set of all measurable subsets of E,,, let i] ans atone A Ed non-negative 
measurable function on £,. For & we choose the set of those subsets Bea 
for which 


m(B) Fie X9, 2 = +) Xe) OX, AXy. ». AXp 
B 


is finite and positive and we suppose that s8 is not empty. 


(py — BAS) 
ae M(B) 
for A€Q and BES. Clearly [S,, &, P(A|B)] is a conditional probability 
space of simple quotient-type, provided that B is not empty. 

Especially, when /f(x,, %.,...,X,)==1, we obtain a conditional proba- 
m(AB) 
win(B)<* 
measure of the measurable set C; in this case 38 consists of all measurable 
sets which have a positive and finite Lebesgue measure. The conditional 
probability space thus obtained will be called the uniform conditional proba- 


bility space in F,. 


bility space, for which P(A|B)= where m(C) denotes the Lebesgue 


b) Let S denote a finite or denumerable set, with elements a,, Qs, ..., Qi, ...} 
let p. (k= 1,2,...) denote an arbitrary sequence of non-negative numbers. 
Let & denote the set of all subsets of S and. the set of those subsets B 
of S for which >’ p,—M(B) is positive and finite. Let us suppose that & 

a, 3 ; 
is not empty and put 


P(A| B)=—=—. for A€Ad and BES. 


Clearly [S, d, &, P(A|B)] is a conditional probability space of simple quoti- 
ent-type. Especially, if p,=1 (k—1, 2,...), we obtain a conditional proba- 
bility space which will be called uniform on the denumerable set S. 


2.2. Conditional probability spaces of alternative quotient-type. A general 
type of conditional probability spaces is described by the following 


THEOREM 14. Let S denote a set, Ay a o-ring of subsets of S if y¢€L 
where I" is an arbitrary ordered set of “indices”, and suppose that Ago Ay 
if B<y according to the order relation of I’. Let us put Ce > Ay. Let By 
denote a subset of A, and put & = 2, By; we suppose that 2, is not empty 

ve 
for any y€I and that &; and 8, are disjoint for P==7. Let us suppose 
that for any y€ I a measure u,(A) is given for A€ A (which can take also 
the value -+- oo), and that if BE By, we have 0O<m,(B)<-+ oc. Let us sup- 
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pose that if 861, 7€ 1, 8< yx (according to the order relation defined in I ) 
and wtg(A)<-+ %, then w,fA)=0. 
Let P(A'B) be defined for A€Q and BES as follows: 
{4(A B) 


uy(B) 


where + is uniquely determined by the condition B € X,. Then [S, a, &, P(A|B)] 
is a conditional probability space. 


P(A|B) 


Proor. Axioms I and II are clearly satisfied. Instead of Axiom III we 
verify the validity of Axiom III’ which has been shown to be equivalent to 
Axiom III. Clearly Axiom III’ is satisfied, because if BE &, and C€ By, and 


2 


BCC, only three cases are possible: B=, 8<y or &>y. The case B=y is 

‘ ase a ae \__ #4 (BC) __ 4 (B) 
evident ™lf=5 — y.P( BiG) Pa SIO) 
we have by supposition «,(B)—0 and therefore P(B C)—0; and thus there 
is nothing to prove. jg 

Finally y < * is impossible, because from C € By it follows «,(C)< 4¥x% 
and thus usg(C)—0, what implies u;(B)—O because of BCC; but this 
contradicts B€ 33. Thus Theorem 14 is proved. 

The conditional probability spaces described by Theorem 14 will be 
called “conditional probability spaces of alternative quotient-type’”. If Be By, 
we may call y the “dimension” of B, and say that the measures uw, are 
“dimensionally ordered”. 

We mention two special cases: 


and as u:(B)< ~ and S<y, 


a) A special case of a conditional probability space of alternative 
quotient-type is obtained as follows: let f(x,,x.,...,X,) denote a non-negative 
Borel measurable function in S—E,; let A denote the set of all measurable 
subsets of E,, and s& the set of those measurable sets B, for which either 
(Bb) | P(X, ,+++5Xn) AX, dx,++- dx, is finite and positive, or B is contained in a 


k-dimensional subspace F;(?'"""""-* of E, (k=1,2,..., n—l) defined by. 
Xiy = C1y Nig = Ca, +++) Xin_p = Ciy_~, and the integral 


(27) ee OG | fa, Xo; «sty tn) OX OMe Oe 
BR 

is finite and positive, where /,, /,, ..., /, denote those of the indices 1,2,...,2 

which are different from i,,i,,...,i,., and in (26) xX;,=C,, Xi, = Ca,» »; Xi = Ce 


are substituted; we suppose that & is not empty; in the first case we 
put ; 


P (AB) els 


ON A NEW AXIOMATIC THEORY OF PROBABILITY 307 


if B€ & and B is contained in E{" @ et we put 
ka ee tes AB 
P(A iBy= a ( ) 
a See té)) 


where Qi!) "7" is defined by (27). 

b) Another special case of a conditional probability space of alternative 
quotient-type is the following: let SE, be the n-dimensional Euclidean 
space, @ the set of all Borel measurable subsets of E,, &, the set of those 
Borel measurable subsets of E,, which have finite positive k-dimensional 
Mu 1(B) 
Beée&,, where m;,(B) denotes the areal Lebesgue measure of the 
set B. Clearly this conditional probability space is an extension of the 
uniform conditional probability space mentioned in 2.1, a). 


measure’ (1=k=n). Let us put B= -> &, and P(A|B) = 


2.3. Cavalieri spaces. Now we introduce a general concept, that of a 
“Cavalieri space”. Let [S,a,%,P(A|B)] be a conditional probability space 
and let us make the following assumptions: 

C1. To every real number ¢t (¢ =¢<) there corresponds a set C;€&. 

C2. For any numbers a and 6 for which e=a<b=8 


Ci= > GES. 
aSt<b 


Co. ee s= t= 4, weihave) C;:C,— ©. 

C4. If for AEA, A’ EA, we have P(A|C,;) =AP(A’|C,), where 2=0, 
for every ¢ lying in the interval [a,6) (e =a<6 <8), it follows P(A|C2) = 
= 1P(A’|C2). : 

If C1—C4 hold, we shall say that [S, 4,8, P(A|B)] is a Cavalieri 
space with respect to the family of sets {Ci;@ =t< 6}. 

Let us mention that if instead of a family C, of the power of the con- 
tinuum we consider a denumerable set {C,,} satisfying properties C1, C2, 
and C3, then (as it has been mentioned in the remark to Theorem 7) C4 
is always satisfied. On the other hand, Theorem 14 shows that conditional 
probability spaces in general are not Cavalieri spaces with respect to a family 
{C,} of the power of the continuum, satisfying C1, C2 and C3, because if 
P(C,|C;)=0 for a=t< 6, P(A|C,) can be replaced by any other measure » 
for every f€[a, 6), by leaving P(A|C:) unchanged. 

The following simple consequences of the definition of a Cavalieri 
space may be mentioned: if [S,A,%,P(A|B)] is a Cavalieri space with 
respect to the family of sets {C:;@=f</}, then 


7 See [26], p. 108. 


6 Acta Mathematica VI/3-4 
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1° If P(A\C) =4P(A’|C,) for a=t< 5, we have P(A|C2)=4P(A’|C.). 
Il. If P(A|C,) =4 for a=t<b, we have P(A|Cz)=4. 
As a matter of fact, if P(A|C,)—4P(A’|C) for as £220, we have 
P(A|C,) = 4P(A’|C;) and thus by C4 P(A|C;) = 4P(A’|C.), further (if 2>0) 
, I : 
we have P(A’|C) <7-P(A|C) and thus P(A’|/C;)= = P(AIC.), i. €. 


2P(A’|C’) = P(A|C)= 4P(A’|C") (also for 20) and therefore P(A|C.) — 
—AP(A’|C?). . | 
On the other hand, II follows from I by choosing A’ —C,. The notion 


of a Cavalieri space can be extended by replacing the one-parametric family 


{C,} by a k-parametric family {C,,,1,,...,%3 @ St< @i;i=1, 2,..., kK}. 
2.4. Regular spaces. Let 3 —[S, A, 8, P(A|B)] denote a conditional 
probability space with the following properties : 
R 1. To every real number ¢ (@ =¢ =) there corresponds a set Ri € &. 
R 2. For any pair of numbers a, 6 (« =a<b=8) Ri=— ps, R ES. 
R3. If e=s<t<8, we have R.-R:=O. met 
R4. If A€ a, P(A|R,) is a Borel measurable function of ¢ for est <p 


R5. There exists a strictly increasing and continuous function F(#) in 
(a, °) with the property that if e=a<b=8 we have for any AEA 


| PUR) art 
(28) P42) 
| dF) 


In this case we shall say that 3 is regular with respect to the family 
(Ri;@=t< }. If F( is absolutely continuous, we shall say that & is 
absolutely regular. 

Clearly if § is regular with respect to the family {R;}, it is also a 
Cavalieri space with respect to {R,}.° As a matter of fact, C1, C2 and C3 
are identical with R1, R2 and R3, and C4 follows from R4 and R5. 

It is easy to prove by using FUBINI’s theorem, that if Of XG; Xap ees Xe) Se 
the conditional probability space defined in 2.2, a) is regular with respect to 


* This consequence of the definition of a Cavalieri space (for 2-1) is analogous 
with the well-known “principle of Cavalieri” (according to which if the areas of the 
intersections of two solids with every horizontal plane are equal, the two solids have the 
same volume) introduced by Bonaventura Cavauiert (1598—1647) in 1635. This justifies the 
name “Cavalieri space’’. 


% J. Czipszer has shown that there exist Cavalieri spaces with respect to a family 
{R.} of sets which are not regular with respect to the same family {R,}. 


~ 
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the family {R:} defined as follows: R, is the set of points (X,, X2,..., X,) for 
which a= x;< b; for is=k, i=1,2,...,n, and.n4—=f (Qs 7 <8). 

It is clear that if S is regular with respect to the family {R:;@St<}, 
we have . 


(29) lim P(A|R:")=P(A|R) 


h>0,h>0 
for almost every ¢ in (@, ) with respect to the measure generated by F(t) 
on (a, *) for any fixed A. 

It is also evident that if S is regular with respect to the family 
{Ri;@St<}, we have P(R,|R;)—0 for exa<t<bv=~P. 

Let = §(a) (a€S) be a random variable on a conditional probability 
space 3—[S, A, ®, P(A|B)], further let us denote by R; the set of those 
aéS for which §(a)—t (—~ =t< +o). Let us suppose that § is regular 
with respect to the family {AR}, i.e. we have for A€ 


| P(A|R)dF(t) 
(30) 0 
JadF() 


for —~ <a<b< +o. Evidently the conditional distribution generated by & 
on the real axis is the distribution 

F(b)— F(a) 
F(d)—F(c) 


gee aoe = <d) == P(RAR) = force a<0 ad 
i.e. F(x) is the (generalized) distribution function of & If (30) holds, we 
shall say that € has a regular conditional distribution with the distribution 
function F(x); if F(x)=x, we shall say that € has a regular uniform 
distribution. 

The notion of a regular space can be extended by replacing the one- 
parametric family {R,} by a k-parametric family {/e,,»,...,4,}- We consider 
only the case when the following postulates are satisfied: 

R1. To every point T=(4,4,...,t) of a k-dimensional interval 
l=(@¢; St <6; i=1,2,...,4) there corresponds a set R€ &. 

R2. For any subinterval J=(G Sti < bi; 212, tas) where 
ee ap 0; = Pe (i= 1, 2; 25k) we have Rr = 2 Rr eB. 

TE 

feos, Af 1352 Ts, ‘we have Rr, T, == O. 

R4. If A€4,P(A/Rr) is a Borel-measurable function of the variables 
Pe lies vaste i 

R5. There exists a function f(t,t,-..,f) which is positive 
and integrable on /, and if / is the interval «a; = t; < be = 1, 2; -~.,, k)s 


6* 
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(eS 4:26; = fF i= 15 2,.04, 1) we have 


[PCA Ra)flt, to. tidt dh 
P(A|R) — — 


ic OMe iat eis 


if RI—R5 hold, and f(t,.. t) = 1140) we say that the space is abso- 


lutely regular with respect to the family {Rr} with independent en 
Especially if Rr is the set defined by §&;=t,...,5—= fi where & Sy eee 


are random variables defined on [S, A, &, P(A|B)] and f(t, .-.,t.) = Li (t;), 


the random variables &,...,§ are independent with respect to any Ry, 
further & has a regular conditional distribution with the generalized density 
function 7;(2) (/==1, 2, -2.,,4)- 


2.5. Remark on Borel’s paradox. The notions of Cavalieri spaces resp. 
regular spaces introduced in the preceding sections, are connected with the 
well-known paradox of Bore. (Cf. [1], p. 44.) Let S denote the surface of 
the unit sphere x*+-y?+ 2’—1; let us introduce spherical coordinates g and 
7, defined - by x=cosg:sin J, y=sin sind, 2—= Cos 7 (U0 = Oe 
0 = #<-z). Let us denote by the set of all Borel subsets of S (i. e. sets 
A for which the set of all pairs of numbers (.%, g) for which the correspond- 
ing point belongs to A, is a plane Borel set). Let us denote by & the set 
of all sets By’ defined by the inequalities a= y= b,c=%=d, where 
QSas bs 2a and-0Scads xm. Lets: put 


| | sin $d ody 
AB? b, ‘ 
> a if ac b, 


i | sin daddy 


a 


P(A\Bis") — 


i. e. let P(A|B) for fixed B be proportional to the area of AB. Let us denote 
by B, the set p=t,0= P= (i.e. put B,— Bro); let us choose a bounded 
measure es defined on the Borel subsets of B,; and normed by 
“(B,) = 1, and put 


(ABP?) 
1 (Br!) 
and let us suppose that P(Bo/)"|B,) — F(x, t) is a continuous function of x 


and ¢, strictly increasing as a function of x. Clearly [S, a, &, P(A|B)]|=S 
is a conditional probability space by any choice of the measures (A); we 


P(A| By) = Ga cod=7); 
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shall prove that itis a Cavalieri space with respect to the family {B,; OSt<22} 
if and only if 
(31) u;(A) = ; sin Ady. 


AB, 


This can be shown as follows: let us suppose that 9 is a Cavalieri space 
with respect to {B;; O=f<2z}; let us choose a number.2 (O=’< 1) and 
define x(¢, 2) as the number for which, if A,(Z) denotes the interval 0 =.9 = 
= x(t, 2), we have P(A;(A)|B,) = 2, i. e. F(x(t, 4),t) =A. Now it follows from 
our supposition, that x(¢,2) is a continuous function of ¢ and thus if 
AQ) = > A:(2), we have A(A) € G, further P(A(A)|B,)) =A for O<t<2z. 


It follows by II of 2.3 that putting B?7—B’, we have P(A(A)|B’)—A for 
b x(t, A) 


ee ee p< 270, i. e: s | | sin ¢d Idt—4(b—a). By taking the derivative 
rs 0 
of both sides, with respect to 6, by virtue of the continuity of x(f, 2), we obtain 
a(t, r) 
that 23 sin #d. + — 2 for every t (0 =t< 2-2). Thus, it follows easily that 


0 
(31) holds. 

Our result can be stated as follows: the uniform probability distribution 
on the surface of the sphere combined with arbitrary distributions on the 
meridians »==f gives always a conditional probability space, but this space 
is a Cavalieri space with respect to the set of meridians (under suitable con- 
tinuity restrictions) if and only if the density of the distribution is on every 


meridian the same, and equal to . sin 4. In this case the conditional prob- 


_ ability space is clearly also regular with respect to the set of meridians, as 
we have 


b 


aoe | | P(A|B) at 
b mg. gq. eee ia ie 
P(A | B:) == A + | | 2 sin Ad J | dt D 
a’ AB, | dt 


2.6. Composition of conditional probability distributions. Let us suppose 
that &; —-§(a) (j=1,2,...,4; a€S) are positive random variables on the 
conditional probability space 8 —[S, A, &, P(A|B)]. Let us denote by R.,,+,,...,», 
the set of those a€S for which &(a)—t¢,...,& (a) = and suppose that 
the space § is absolutely regular with respect to the family HR eee 
O=t< +o; i=1,2,...,k}, with independent parameters and thus the 
functions F;(7;) figuring in R5 are absolutely continuous and F;(t)=—/;(0) 
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is almost everywhere positive (0<t<- ). Let us suppose further that it 


M is a Borel subset of the k-dimensional Euclidean space, > Riga. 
(t,, «5 HEM 


belongs to 3%. In this case if / and /©]/ are k-dimensional intervals, 
[=(@,20< 8; i==1,2,...,k) and) |) = (Qe ba ae 


where OS @;=0,;< 5;= 8; ((=1,2,...,%), we have, putting Ee (Ejio-P ae: 
t 


_ |Alt)at 
(32) PECIECN= TI 
| | Fi(t)dt 
oF 
Thus the random variables §,,5,..., & are independent with respect to any Ry. 


Let us calculate the conditional probability distribution of &,—&,-++-& + 
+ +++-+&. Let Br be the interval O=4;< T (j— 1, 2,...;k)-and -A, the set 


defined by 5,<z. Clearly, A-€ 8, asA-= > B,.4,; we have by R5 


aw 
tyttet...tt 


i Wy f(t) dt; 


P(A.| Br) = = = a 
IT | |f@at) 


Now let us suppose that 0 = z, < z,< T; in this case A.,© A.,© By and thus 


| Wl f(t) dt 


P (Ay | Br) =e 
IT (| far 
and Y 
P(A.,|A.,) = P(A,,|A.,Bp) —- - Ax4s|Br) _ P(A.|Br) 


and thus P(A.,| Br) P(A.,| Br) 


| I f(tat 


k 
Sy P 
a my 


(33) P(A,,|A,) =H | 
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It follows that if we put 


ZO=AO and gi(t)—|gt—wf@du it t=0 
and ‘ 
Pl e-0rtt— 0a 8 (f= 2:3," fh), 
we have by (33) 


_faoa 
(34) P(An|4,) 32 


{ gu(t)dt 
Thus S(t) is the generalized density fincton Ole 
If fiat <+% (j= 1,2,...,4), we obtain as a special case’the 
well-known law of composition of independent probability distributions, but 


clearly some or all of the integrals |n@at may be divergent. 


The method of Laplace transforms can be applied also in the case when 


Jnoar— + co, but is #f(1)dt = q,(s) exists for some s > 0 (j= 1, 2,..., k) 


a 
o 


and in this case we have, putting w,(s)— | eg (t)dt, evidently 
; 
Un. (Ss) = i (Ss). 
JF 


If e. g. § and » are independent, regularly distributed random variables 
which have the (generalized) density functions x*' resp. x?! in (0, -+ ov), 
where e>0 and @>0, the (generalized) density function of the random 
variable €+-7 is x***!. A striking property of the random variables with 
density functions x*1 (0<x<-+ ov) is the following: if & has the density 
function x*"! in (0, +) and C>0O is a constant, the random variable C& 
has the same density function. 

The problem of composition of distributions in the general case (i.e. if 
it is not supposed that the random variables considered are positive) is more intri- 
cate.” If € and 7 are independent random variables with regular joint distrib- 
ution and density functions f(x), g(y), respectively, and the limit 

+A 
| fe—y g(nay 
lim = ; = h(x) 


+A 
A> 


| fe —ngQyay 


a 


10 The theory of “distributions” of L. Scuwartz has to be applied. 


314 A. RENYI 


exists uniformly in x and is positive on a set of positive measure, then h(x) 
is the density function of +7. This implies for example that if the distrib- 
ution of 7 is uniform on the real axis, the distribution of §-+-7 is also 
uniform, whatever the density function of € should be. 


§ 3. Some applications of the notion of a conditional 
probability space 


In this § we consider simple applications of the notions introduced in 
§ 1 and § 2 to some problems of ordinary probability theory. The random varia- 
bles considered in this § are thus random variables defined on an ordinary 
probability space [S, 4, P], except when it is explicitly stated that they are 
defined on a conditional probability space. 


3. 1. The limit of the Poisson distribution for 4-+»+-c. Let & denote 
a random variable which is distributed according to Poisson’s law with mean 
value 2>0. The random variable & generates the probability distribution on 
the set J, of non-negative integers 


Di (4) = P(E. = k) = 


It follows easily from Stirling’s formula that 


-1 


hke 
k! 


(k= 0, 1, 2). 


. Prpi(A) 
35 lim ——=~_ = 1 
oS) ro Dprjr(A) 
for j,kK=0, +1, +2,...; thus if J is the set of all integers, A and B are 
finite subsets of J and B is not empty, then we have 
n(AB) 
n(B) ’ 
where n(B) denotes the number of elements of B. The result can be stated 


as follows: the conditional probability distribution generated by £&,—[A] on 3 
tends to the uniform conditional probability distribution on 3 if 2—>-++ x. 


lim P(&,—[2] € A|&—[2] € B) = 


3.2. The number of prime divisors. An interesting application of the 
result in 3.1 to number theory is as follows: let U(n) denote the number 
of different prime divisors of the integer n; let :t,(N) denote the number of 
those natural numbers n == N for which U(n)—k. By a theorem of P. ERDOs 
[16] we have 


7t;;(N | r 
(36) eMeh a eee e-loglog N 76} +. o(1)) 


' 
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of positive integers n=N for which D(n)—k, we have by (35) and (36) 
P(N) __ 

N->o P,, (N) 
for f,e—U, 1, -+-2,...; thus the conditional probability distribution of the 
number-theoretical function D(n) (l1=n=N) tends for Noo to the uni- 
form conditional probability distribution on 3. 


3.3. The normal distribution for o—+-+- oo. Let § be a random variable, 
normally distributed with mean value 0 and variance o% Then we _ have for 
fe 0-0Sd 


Piast —b\c= 7 < ic = 


and thus 
jim P@=<, - < be <8, <d)———" 


fae. the POI Benbability distribution, generated by § on the real axis 
R tends for o—-+ - to the uniform conditional probability distribution on &. 


3.4. Limiting distribution of the sum of independent random variables. 
Let &,&,...,&,... denote independent random variables; let us suppose 
that the variables &, have the same distribution with the density function f(x) 


for .which | f’(x)dx exists." Let us suppose that M(é,)—0O and 
iP - 
M(®) = | xf@)dx=D'<+~. 
Let us put ¢,—6+&-+---+6,. Putting 


p(t)= | el! f(x)dx (—o0 <t< + ov), 


we have | p(t) "dt < 4-0 for n= 2 (see [17]), and thus denoting by /,(x) 
the density function of ¢,, we have 
+0 
1 ; ny ~—ite 
(37) fr(x) = OE (g(t)) e dt. 


11 These conditions can be replaced by weaker ones. 
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As by supposition |p(t)|==1 for t==0 and Jim Te , it follows easily 
by the method of LAPLACE (see abe that 


(38) fi) = ES (1 +0(1)), 


where 0(1)—>0 if n—ov, uniformly for |x| = C, where C does not depend 
on n; thus for c=a<b=d we have 

b—a 
(39) imP@sS(. ica. <d)=7] os 


n-> © c 


i.e. the conditional probability distribution generated by ©, on X tends to 
the uniform conditional probability distribution on R for no. 


3.5. A connection between the uniform conditional probability distribution 
on &, and on 3,. Let [S, 4, ®, P(A|B)] denote a conditional probability 
field, <= &(a) (a€S) a random variable, which takes only non-negative 
integer values; let us denote by A; the set of those a € S for which E(a)—k, 


n 


putsb,—= Ag and let us suppose that A; € @ and B, € & (k,n —0, 1, 2,...). 
k=0 


Let us suppose that 4—A(a) is an other random variable which generates 
a regular uniform conditional probability distribution on the positive real 
axis R,; let us denote by C; the set of those a€S for which 2(a)—¢ and 


pit pa Cy; let us suppose that C, € &, D,€ &, further that B,D, ¢€ & 


O=Sy 


(0<x<+o, aw 1,2,...). We suppose 


(40) P(A.|C) = (k=0,1,...); 


s 
i.e. that § has a Poisson distribution with mean value ¢ under the hypothe- 
sis that Zt. We shall prove that in this case the conditional probability 
distribution generated by § on the set of non-negative integers 3, is the 
uniform distribution, i. e. 


1 


P(A;|8,) =P(E= hie an): ena for 2k==O0)1,..4n:n=0 eee 
This can be shown as follows: We have by Theorem 12 
P(A;|D-) 
41 | ») = e aT 
(41) (Ax| Bn) = lim P(A;| Bn Dz) = lim 1 -P(BulDa) 


As we have supposed that the distribution of 2 is not only uniform on A, 
but also regular, we have 


(42) P(A|D,)- o P(AIC)dt 
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and thus by (41) and (42) 
| P(A C) at 
(43) PA eee 


> | P(Acyat 


As by (40) 
5 o Ss 


it follows from (43) that 
P(As|B.) = 55 
which was to be proved. 
A realisation of what has been said can be given as follows: let S 
denote the strip O=x<+ oo, 0O=y<1 of the (x,y) plane, & the set of all | 
measurable subsets of S, & the set of all Borel-measurable subsets of S with 


7 


Fig. 1 


positive and finite measure, and of all sets of positive linear measure lying on 


m (AB 
some line x =t (0 =t<-+ ov), and let us put P(A|B) = - ae if m,(B) >0, 
where m,(B) and m,(AB) denote the plane Lebesgue measure of B and AB, 


m (AB 
respectively, and put P(A|B) = Sa if B is lying on a line x =f, where 
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m,(B) denotes the linear Lebesgue measure of B. Define 2 as follows: 4— 

—A(x, y)==x, and define §=&(x, y) as SEE for a Pee value of x let us 
5 yx! 

have E=0 for O=y<e", and Ek for © i =y <> Sar (k=l, 2,...). 

The sets A, are shown on Fig. 1. 

Clearly each set A, (kK=0,1,...) has the area 1. Our result can be 
stated in the following suggestive form: if § has the Poisson distribution 
with mean value ¢ under the hypothesis 2—¢ and the conditional distribution 
of 2 is regular and uniform on &,, § is uniformly distributed on 3,. Clearly 
the result obtained is a consequence “ ing following remarkable property of 


the Poisson distribution: each member ae of the Poisson distribution is as 


a function of 4 for fixed & a probability density function in the interval 
(0=’4< +o). 

3.6. Remarks on the method of Bayes. Let 3 =—[S, A, &, P(A|B)] denote 
a conditional probability space. Let = &(a) and 7 = 7(a) (a € S) be random 
variables on & and suppose that ¥ is regular with respect to the family of 
sets R., defined by §==x,n=y for —2<x<+00; —w<y<+too and 


let us suppose that Ru’ —=  >- Re €R where —w<c<d<+0, 
ex<r<d, y=y 4 
—oo<y<d0<-+ 00, further if —~=c sere =+-o and —~<y<d<+o, 
we have 
d éO 
| Ea R.., h(x, y)dxdy 
(44) P(A|R:y) = rer . 


| | h(x, y)dxdy 


where f(x, y) is positive and Heat on any finite rectangle of the (x, y) 
plane. 
Let us suppose further that R?,/¢€B if c<d and R°2ER if vy <0, 


further that we have é 
d 


[PAIR A(x, yax 
Se) P(A|R?y) = + $— ae 
| h(x, ydx 


and 


| P(A R,) A(x, »)dy 
ee ECR) eee — (<9). 


7) 


fa (x, v)dy 
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‘In this case clearly for any fixed y, A(x, y) is, as a function of x, the condi- 
tional density function of € under hypothesis ™4=y and, for any fixed 
x, h(x, y) is, as a function of y, the conditional density function of 1 under 
the hypothesis 5x. As a matter of fact, choosing y=0=y we have for 
6 =a<b=d from (45) 


b 
| A(x, dx 
(47) Pa@=f<blesi<d,n=y)——+ 


| h(x, y)dx 


and choosing «@=-$—x we have for y=a@<=0 from (44) 
8 
JAG nay 
(48) P(e =n<Aly =n<d§=n = 
Jac yay 
ay 


It should be mentioned that the set R, defined by €=—x is not sup- 
posed to belong to 3%, and thus A(x, y) is not an ordinary conditional den- 
sity function, but only a generalized conditional density function, in the sense 
defined in 1.6. By other words, A(x, y) is the generalized density function 
of the random variable 7 on the subspace (R,, C:, %.,P,) of (S, A, B, P) 
where «., is the set of all sets of the form AB, with A€d, &%, the set of 
all sets B€ & which are subsets of R, and P.(A|B) is defined by 


P,(A|B) — P(A|B) 


for A€d, and BE &,. If R,€R, clearly A(x, y) is up to a constant factor 
the ordinary conditional density function of 7 under the condition A, and 


in this case f(x) =| A(x, y)dy is finite. 


Lia ix) —— | h(x, y)dy is finite for every x, then f(x) is the generalized 


density function of & As a matter of fact, we have by Theorem 12 


b 
|Feoax 
P(asé<b\c=é<d)=lim P@ =$<dlc=S<d, V¥=en<0)=5 : 
ee | f(x)dx 
Putting 
h(x, y 
(49) 2012) wi 


besides A(x, y), g(y|x) is the normed (i.e. ordinary) conditional density func- 
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tion of 7) under condition =x. Similarly, if we denote by F(x|y) the gener- 
alized conditional density function of § under the condition 7—y, we may 
put f(x|y)— A(x, y) and thus we have 
(50) F(x|y) = 8(y |x) FQ). 

+00 


If | A(x, y)dx is also finite, 


(51) f'(x|y) = ABATE 
| £0) fe) ax 


is the normed (ordinary) conditional density function of € under the hypo- 
thesis 7—y. 

The result obtained in this § is a generalization of the well-known 
method of Bayes. The generalization consists in the possibility that 
+o +0 


| f(x)dx and | f(x|y)dx may be divergent. 


Clearly if A(x, y) vanishes in some points of the plane, all what we 
have said remains valid, only we may use as conditions only such sets 
ds 


¢=E<d, y= <6 for which | | A(x, y)dxdy >0. 
Cory. 


3.7. Conditional ergodicity of Markov chains. Let us consider a tempo- 
rally homogeneous Markov chain with a denumerable set of possible states ; 
let us denote the states by the numbers 0, +1, +2,... and put §& —& if 
the system is in state & at time n (n=O, 1, 2,...). Let us denote by Pj, the - 
probability of passing from state / to state k in one step, i.e. Py, — 
=P(E.u1—k|§.—/). We introduce the following notion: if there exists 
a sequence P, of positive numbers, with the property that, putting 
P(E, = k|& =/)= Pr’, we have . 


° Pro P; 
6) oe PR TPs 
for all A, i,j,k =O, +1, + 2,..., we shall say that the Markov chain is con- 
ditionally ergodic. If the chain is ergodic in the usual sense (see [18]), i.e. if 
(53) lim Pi = P, >0 (i, k=0, +1, +2, ...), 


n> 0 
+0 


then (52) holds and we have >’ P,——=1. 
k=-@ 


It is possible, however, that (52) holds without (53) taking place; 


+0 


especially, this is the case if (52) holds and >» P,—=-+-~. If a Markov 


k=- 0 
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chain is conditionally ergodic, this implies that the conditional probability 
distribution generated by §, on the set of integers converges to the con- 


gia! 


2) Py, 
ditional probability distribution defined by pee Spe where A and B 
kEB 
are subsets of the set of integers and B is finite and not empty. 
Let us suppose that the Markov chain considered is irreducible and all 
its states are recurrent null states (see [18]) in which case lim P{? —O. If 


nu-> © 


the numbers P;, in (52) satisfy the system of equations 


(54) Pr aw a P; Pix (k =0, 65 l a2, ae )5 
j=-@ 

we say that the conditional limiting distribution defined by the numbers P,, 

is a stationary distribution. If the conditional limiting distribution exists, it is 

always,a stationary distribution, i.e. (52) implies (54). As a matter of fact, 


as we have supposed that all states are recurrent, the series > Py;’)(k—O, +1...) 


n=1 


diverges, and thus, it follows from (52) that 


(55) V, == lim ———_ = 


But it has been proved by C. DERMAN [19] that if all states of an irreducible 
chain are recurrent null states, the only solution P,—V, of the system of 
equations (54) with V,— 1 is given by the limits in (55) which always exist. 
The existence of the limits (52) has been proved by P. ERDOs and 
K. L. CHUNG [20]. in the special case of additive Markov chains. Let us 
consider an additive Markov chain, i.e. put &,—&-+0,-+0,+----+0, where 
the 0,’s are independent equidistributed random variables which take only 
integer values, further suppose that the following conditions are satisfied: 
Let us put P(d, =r) = W, (r=0, +1, +2,...). We suppose that the 
greatest common divisor of the differences r—s where r and s are such 
integers, for which W.>O and W,>0, is equal. to 1, further that 


‘ +o +0 
Dd |riw.<+% and > rW,—0. It has been shown by K. L. CHuns 


and P. Erpos [20] that in this case the chain is (in our terminology) con- 
ditionally ergodic, and the limiting conditional distribution is the uniform 
distribution over the set of all integers, i.e. P,=1. If the variance 

+o : ag 
D?— > PW, of the variables 0, exists, this follows easily by LAPLACE's 


y 
r=- 0 


322 A. RENYI 


method; aS a matter of fact in this case, putting p(t) — a W,.e"', we have 


+0 


(56) Pileaae a J wore Cie dt 
and thus, by LAPLACE’s method, 

(57) | PY ~ Aiea 
what implies ve 

9 ln pg 


If D= + 9, the proof is more intricate. 
The existence of the limits (52) in the general case is still open, as has 
been pointed out by CHUNG [21]. 


3.8. Ona paradox of the renewal theory. Renewal theory (s&® [22]) 
deals with stochastic processes of the following type (“recurrent pro- 
cesses”): events occur at the moments 0<1,<%<---<T,<-+:: where 
the differences t,—vt,1—&, are independent positive random variables 
with the same distribution function F(x)—P(&,<x); for any f>0 
let tv, denote the moment when the first event after time ¢ occurs, 
i.e. we suppose Trwm-1St<Taw and put AM—ttaw—t; A(t) is the 
waiting time at ¢, i.e. the time somebody arriving at time ¢ has to wait 
until the next event occurs. Let us now suppose that somebody arrives at 
random in the time interval (O, 7) at time +, where v is uniformly distributed 
in (0, 7) and let us put 0(7)— (vr). It has been proved by W. FELLER 


[22] that if m— jxa F(x) (the mean value of the time interval between con- 


secutive events) itt: and F(x) is not a lattice distribution function, the 
distribution of (7) tends for T— oe to the limiting distribution 


£. 


(59) H(x)== lim P(9(T)< y=—| (1—F(u )du. 
T>o 
It has been shown by L. TakAcs [23] that if we consider 0(7) instead of — 


I(T), the limiting distribution exists for any F(x) with finite mean value, 
and is the same as in the case of 9(7), i.e. we have 


(60) H(x) == Jim POT) <= ‘(1—F(u)) du. 


It has been pointed out by L. TakAcs [23] that the fact that the mean value 
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of the distribution function H(x) is i where o° denotes the variance 


mor &,, i. e. o* =| (x—m) dF(x), implies that if o—-+ 0%, the mean value 


of 0(T) tends to +o in spite of the fact that d(T) is the part of some 
time interval €, having the finite mean value m. 

The situation is still more paradox, if m— -~; it can be shown (see [9]) 
that in this case 


(61) lim P(d(T) < x)=0 
T>o 
for all finite x; nevertheless, if putting G(x) =| (I—F() dt the condition 


PO « eC), 


is satisfied, there exists the limit of the conditional distribution of 0(7), and 
we have 

G(x) 

lim P(6(T) < x|0(T) < y) = = 
(63) lim P(T) he es fy) 


3.9. Deduction of Maxwell’s law of velocity distribution. Let us 
consider an ideal gas consisting of N particles with equal masses m, let 
=, 1%, =. denote the x,y,z-component of the velocity of the k-th particle; 
we suppose that &, 7., 5; (k=1,2,...,N) are random variables defined on 
a conditional probability space [S,4,%,P(A|B)]. Let us suppose that the 
conditional probability distribution generated by the variables &., 7, ° 
I], 2 NN) in the 3N-dimensional Euclidean space is uniform, further 
that the space is regular with respect to the sets defined by & — Xx, %j:—=Yyx, 
bp — Zz, (99 << 4 0, —O Kec o,—w Kc aA<+o; k—1,2,..., N), 
further that the sete ay cata tay belong to &, where R,,,..., 1, is 

Ey oss tag : 
the set defined by b cht, suai bi= te, f= fh, Gat bis Cn = by and M is a 
Borel subset of the 3N-dimensional Euclidean space, further that the Space 
is also regular with respect to the sets defined by &+7+i5—2z, 
(k=1,2,...,N; 0<z%<-+ -%). All these conditions are satisfied, if S is 
the 3N-dimensionat Euclidean space, € the set of all Borel subsets of S, 
&, the set of all Borel subsets of S which have positive and finite k-dimen- 


for O<xSy<+ 0, 


BN 
sional measure (k= 1, 2,...,3N), &, the set of all points of Sand B= 2M 
and we put P(A/B)—1 if BER and BCA, P(A\b)=—0 if BER, 
and BCA, further P(A|B) = 2). if BéB., where m,(C) is 

k 


the k-dimensional measure of C (k=—1,2,...,3N), further if denoting 


7 Acta Mathematica VI/32—4 
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by P=(%4,)i,21,---. Xn, Yn, 2x) a point of S, we put §(P)—x, 
.m(P)=yn, s.+) 6n(P) =2n. 


1 eee re 

It follows that the kinetic energy ¢— ay mE + tk + Sx) of the k-th par- 

ticle has the density pete flt Vx for O0<x<-+oo and thus by 2.6 that the 
kinetic energy ¢— de of the whole gas has the density function gy(x) 


defined by the recursion 


£:(x) = |x, ei(x) =| gi-i(x—y) vay for x=0. 
Thus 


BN 
and therefore, as any constant factor is irrelevant, we may take x? (x >0) 
for the density function of «. 


Similarly, the conditional density function of « under condition «, —¢ 
3N-5 


is clearly (x—f) 2 for x=t. It can be easily verified that the conditions 
for applying formula (48) are fulfilled, and thus we obtain that the conditional 
density function of «, with respect to the condition «— E is 


3N-5 
en x 2 — 
a 1— — \x 
EAs EE = | *| 
(lt) oe a ea ed 
iow  Vxdx | aacaf is 
i | 1 E, Vxdx 
lf N is a ee number, we have, putting pase, approximately | 
fea ~e?’ and thus 
f(x|E)~* = -\x-e-P, 
Thus the conditional density function g(x|E)— mxf {5 <|E| of the velocity 
ax ) Ee Ri ae ci of the k-th particle under condition «—E is approximately 


etl oe "se 
etcey~ 24 wes 
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1 vbig 
where o ————. As it is known that = =o io kT where T denotes the absol- 
Vm 2 N 2 


ute temperature of the gas and &k the constant of Boltzmann, we have 
el kT , 
por and om. Thus finally we obtain 


3 
ma 


(64) &(x|E)~ | end As a ae e er (0<x< + 0), 


i. e. Maxwell’s law of velocity distribution. 

Summarising, we may state our result as follows: if the components of 
the velocity of each of N particles are independent of each other and of 
the components of the velocity of the other particles, further if all these ran- 
dom variables have regular uniform (a priori) distributions on the whole real 
axis, then the (a posteriori) distribution of the velocity of each particle under 
the condition that the kinetic energy of the whole system is given, is approxi- 
mately, if N is large, the Maxwell distribution (64). 

The proof given above shows clearly that the law of Maxwell is an 
approximation, which is valid only for a large number of Aa For a 
oul number N we obtain the exact formula 


Eley aN 2 | BN-5 
: | Uk 
2E 


ae ) 
(65) gx(elE)= | = (4 ea 
It can also be shown by the same way that the conditional density function 
of each of the variables &,, 7, %, under the condition «—E is exactly 


(2%) on é 
| Get ieee ae es ee) ee eo 
g66) Gil ae | jah, 1) 2E 220 
m2 


where ees| oie Thus under the condition ¢—E all these variables are 
m 


approximately normally distributed. This is the reason why the velocities have 
a Maxwell distribution, as the Maxwell distribution can be defined as the 
distribution of a variable /®-+-7?+ where & 7,6 are independent and nor- 
mally distributed random variables with mean value 0 and variance o. 


T= 
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§ 4. Conditional laws of large numbers 


Conditional probability is in the same relation to conditional relative 
frequency as ordinary probability to ordinary relative frequency. This relation, 
which is well known as an empirical fact from everyday experience, is de- 
scribed mathematically by the laws of large numbers. 

The laws of large numbers concerning the behaviour in the limit of the 
conditional relative frequency (and generalizations concerning conditional 
means of observations) shall be called “conditional laws of large numbers’’. These 
laws will be investigated in this §. Before going into details it should be empha- 
sized that the conditional probability P(A!|B) is considered in this paper as 
an objective characteristic of the random event A, under an objective condi- 
tion B, and its value as that number in the near neighbourhood of which 


the corresponding conditional relative frequency wie will be found in general, 
B 


if a sufficiently great number n of observations is made, where kz de- 
notes the number of those under the nm observations with respect to which 
the condition B has been realised, and kz the number of those observations 
which gave such results that, besides the condition 6 being realised, the 
event A occurred-also, and it is supposed that kz > 0. 


4.1. A strong law of large numbers. \n this section we consider ran- 
dom variables defined on an ordinary probability space. We shall need the 
following 


LEMMA 1. Let &,&,...,&,... be mutually independent random variables 
with mean values M(&,)—=M, =0 and finite variances D;,—D*(§,). Let us 


n 


put F.= = 5 and A,—M(¢,) = M,+M.+---+M,, and suppose that the 
following conditions are fulfilled: 
a) lim A, ==-++ ©, 


u-> C—O 


peer 
n=1 A; 
It follows that 
(67) PI Sn | 
hs ae peu he 
PRoor. Lemma 1 (see e.g. [27], p. 238) is a consequence of the 
well-known theorem of KOLMOGOROV, according to which if 7,, %,..., In)... 


are mutually independent random variables and M(7,) =0 (k=1, 2,. ») then 


> mx converges with probability 1, provided that the series >’D*(,) — con- 
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verges. Lemma 1 can be proved also directly by applying the following 
inequality which has been found recently by J. HAjEK (seer{l2}).: 


LEMMA 2. Let 7, %,..-, n,.-. denote mutually independent random vari- 
ables with mean values M(1.)—=0 and variances D°(n,) = Dy, (es eon) 
Let c;, denote a decreasing sequence of positive numbers, ¢. =i. (k= n); then we 
have for any «>0 


(68) P(max erly +--+! = 8) = | Dan = DE 


Cn Tt 
; k srl 


Applying Lemma 2, Lemma 1 can be proved as follows: it follows from (68), 


applied for 7, §&,—M;,, ¢; = ES that 


Ar 
‘za a > PB reo) > 
Pei | a =e ea Dr 
(69) P [sup ac Saar ea ter 
As a) and b) clearly imply that 
D348) 
lim —,— —0, 


(70) iu 
it follows from (69) that 


Bi/ze]—o for any «>0O. 


and (71) is evidently equivalent to (67). 


4.2. A conditional law of large numbers. 


(71) lim P | sup 


nk 


THEOREM 15. Let [S,d,&%,P(A|B)] denote a conditional probability 
space and &,,§,...,£,,... random variables on S which are mutually inde- 
pendent with respect to C€ 8%. Let 3 denote the interval a =x < b (a < b) of 
the real axis. Let B, denote the set of those a€S for which &,(a)€3d, and 
suppose that B,<=C and B,€&; let us suppose that M(,,|B,)— M, >0 and 
D’(é,|B,) = Dy exists (n=1,2,...). Let us put P(B,,|C)=pn and suppose 
that the following conditions are ealished’ 


AD) DS Pr=+oo and 2 ppMr=+e; 
n=l aes 
> pi Mi 
(73) Shih Y sae seeewaoaeet 
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exists ; 
Sp Dit 1) Mi 
(14) > De Dut ALE Pe) ME eitheee 
j=! 
Then we have : 
(hoes Si | 
fred | 
P| lim ==" = MIC f=. 
(75) n—-> ey ] | 
Seg 
L=k=n2 


Proor. Let us define the random variable « as follows: & 1 if &,¢€3 
and «,—O if & €3; let us put &—&.«,. Then we have 
M(S|\C)=p.M, and M(§P|C)—pi(Di+ Mr). 
and thus 
D?(&|C) = p.(Di + (1—px) M2). 
Applying Lemma 1 to the sequence & of random variables on C, it follows 
that 


(76) P lim = —<11/¢ 31. 
| 


On the other hand, let us apply Lemma 1 to the sequence of random vari- 
ables «, on C. As 


M(«,|C)==p, and D*(«,|C)=p.r(1—px), 
it follows that 
> & | 
ein P| lim ———1|C } 
iti» Dp) | 
k= 
Combining (76), (77) and condition b) of the theorem, and taking into 
account that 


u Ww 
7 p | | , 
Sas ee. N as 
eel Oh > E; and haat ] Ex, 
Sh E SS k=1 KET i 
LSk=n l=k=n 


(75) tollows. Thus Theorem 15 is proved. 

The statement of Theorem 15 can be expressed in words as follows: 
the conditional empirical mean value of those of the variables eA 
which take on values lying in the interval 3, converges with conditional prob- 
ability 1 with respect to C to the limit M defined by (73). In the special 
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case, when M,—M->0 and D,—D~>0 do not depend ona, the conditions 


(72)—(74) reduce to the single condition that the series Do, diverges. 


n=31 


Especially let us suppose further that 3 is the closed interval [0O, 1] and the 
only values in § which the variables & can take on B, are the values 0 and 
1 (of course &, can take also other values outside 3). Suppose that A,, is the 
set on which & —1, and p—P(A,/B,)>0O does not depend on n. 

In this case the events A, and B, can be interpreted as the events 
consisting in the realisation of some events A and B, respectively, at the n-th 
experiment in a sequence of independent experiments, and we may put 
p--P(A!B); in this case 


—_ Sk et 
Keg 2 1 
ft A B SiS =i ken 
ran ap C0 of ici k=n 
1=k 


is the conditional relative ated of the event A with respect to the event 
B in course of the first n observations.” The statement of Theorem 15 gives 
for this special case 


is)- P(lim f,(A|B) —P(A|B)|C)—1, 


if P(B C) >0, i.e. the conditional relative frequency of the event A with res- 
pect to the event B converges with the conditional probability 1 (with respect 
to C) to the conditional probability of A with respect to B. 


4. 3. Generalization of the theorem of Borel on normal decimals. The 
theorem of BOREL [25] states that if f,(k;x) denotes the relative frequency 
of the number & between the first n digits of the decimal expansion of the 
real number x (0=x<1), we have 


(79) lim f.(k; Y= (630,42) <5, 9) 


1» CO 10 
for almost every x; similarly all possible digits occur in the limit with equal 
frequency in the expansion, in the number system with any basis q of almost 


all real numbers. 
We consider a more general representation of real numbers; namely 


expansion of real numbers into Cantor’s series. Let g, (n—1,2,...) denote 
an arbitrary sequence of integers, g, = 2. It is easy to prove (see [24]) that 


12 This interpretation suggests itself in the following special case: let us form the 
Cartesian product of a denumerable sequence of isomorphic penctcndl probability spaces 


1S, Cl, &, P] ard denote by A, resp. B, the sets defined by SxS *---*A*SH--- resp. 
I r4 " 


S*S«---* B*S--- (see section 1.11). 
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any real number x (0 =x <1) can be represented in the form 
Spier eee a 
m= Gigo*** Qn 


where «,(x) may take on the values 0,1,.-.,g,—1; the digits «,(x) are 
uniquely determined except for those rational numbers x which can be writ- 


— 


n=1 On qa° i 
presentation the alternative iafinite representation 


ten in the form x= >) =) (x(x) > 0), where besides this finite re- 


Nr . oe park | kek et 
ee FO aGl Supe 
n=! Q142---Qn Q142---Qn n=—N+1 G192-+--Qn 
is also possible. We shall prove that in the case g,—>-+--, when all non- 


negative integers are possible “digits”, all these digits occur in the limit with 


© 


the same (conditional) relative frequency, provided that Se diverges. This 


n—1Y4n 


is contained in the following theorem which is a consequence of Theorem 15. 
THEOREM 16. Let the numbers q,, satisfy the following conditions : 
a) "dp 1S "ON integer O, = 2 Ol al eee 


b) Ga =WN for n= th, 


Sil sea 
°) " ath z ne ! 


Let us consider the expansion of real numbers x (0 = x < 1) into Cantor’s 
series with quotients g,, i.e. the expansion 


(80), em ee 
n=1 Gido.--Qn 
where &,(x) is one of the numbers 0,1, ...,Q,—1. 
Let F,{k; x) denote how many of the ‘digits’ #,(X), &(X),...,&(x) are 
equal to k. Then for almost every x in (0,1) we have 


(81) lin’ at =1 for 0S j/s=k=N—1. 

REMARK 1. If g,—*ox, condition b) is fulfilled for every N, and thus 
(81) holds for any pair of non-negative integers j and k, i. e. all digits 
0,1,2,... occur in the limit asymptotically with the same frequency, in the 
Cantor expansion of almost all real numbers. This is the case, for instance, 
if g, =n-+-l, i.e. if we consider the expansion 


= kK! 


where «,(x) can have the values 0,1,...,k—1. 


(82) xe &) 
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REMARK 2. It follows from (81) that for almost all x 


5 Fi(k; 1 

(83) lim Fa Sai rey for k=0,1,...,f and 1=1,2,...,N—1, 

2 Ful 53x) 
This is an other way of expressing that the frequencies of all digits 
0, 1,..., N—1 are in the limit equal to another. 

If g,—> ~, we have 
(84) lim eee, for k—0,1,... 

M—+>o 


for almost all x. This can be shown to be a consequence of Lemma 1 (see 
(86) below). 


REMARK 3. Theorem 16 clearly reduces to the theorem of Borel if 
Sea iC for 7#—1,2,.... 
Proor. Theorem 16 is a special case of Theorem 15, but it is more 
simple to prove it directly by means of Lemma 1 of section 4.1. Let us 
_ consider the ordinary probability space [S, 4, P(A)] which we obtain if we 
_ choose for S the interval (0,1), for Gl the set of all measurable subsets of S 
and put P(A) = m(A) where m(A) is the Lebesgue measure of the set A. Let 
us define the random variables §,).=§,(x) (Q=x<1) for O=<k=n—1 
_(n=1,2,...) as follows: 


(85) ¢ ) a \ jae &,(x) = k, 
M cs 10 otherwise. 


The variables &,,; eae 2,...) are clearly mutually independent, further 
"we have M,.—=M(&,.(x)) —=—- and D%;,—D* “End 2(1 —-_| for q,=k, 


+ i.e.for nan, if k<N; ‘i values of M,,. resp. D,i, oe nN < ny are irrelevant. 
Condition a) of Lemma 1 follows from supposition b) of Theorem 16, and 
condition b) of Lemma 1 follows also from supposition b) of Theorem 16. 


Thus we have 


- (86) P| lim S—=1|=1. 
; 4 n =n, Gn 


; As (86) holds for all k—0,1,..., N—1 and 2 En — Fy,(k;x) the assertion 


of Theorem 16 follows. 
The results of this section (as well as those of section 3.2) show that 


_ there exist sequences X,, X»,...,Xn,,consisting of the numbers 0, 1, 2,. in 


which the relative frequency Full Fit) (where F,,(k) denotes how many of the 
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numbers x,,%,---,)X» are equal to &) of every number k==0, 1,27; tendsita 
0 for n—>~, but the conditional relative frequencies converge to definite 


limits, i. e. 


FG). eee ee 
k he k 
DIN AGE Ce 
i—() ) 


J JA 


lim (has 0, te. seks hel eee) 


1—-> © 


where P; >O for kK==-0,1,... and > P,—=-+ ce. Such sequences may be 


k=0 
considered as mathematical models of sequences of observations on a random 
variable & defined on a conditional probability field, and having the conditional 
distribution 


PE=h|0O=E=hK)=-—* (h=0 1). (kk ae 


(Received 25 July 1955) 
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HOBOE AKCUOMATHYECKOE MOCTPOEHVE TEOPUM BEPOSATHOCTEM 
A. Peupnu (Bygzanewr) 


(P e310 Me) 


Paodora cofepxKuT HOBOe aKCHOMATHYECKOe NOCTpOeHHe TEOPHU BEPOATHOCTEH ; OCHOB- 
HOe NOHATHE B ITOH HOBO TeOpnH, ABAAOULeNCsH OOOGuWWeHHem Teopun A. H. Koamo- 
ropoBa, — NoHATHe yCnOBHON BeposTHOcTH. MorpeoHocTb B paspadorKe HOBOM Teopun 
6bia BbIsBaHa TeM, 4TO B Teopun A. H. KoNMOLrOPOBa HeOrpaHn4eHHbIe MEPbI MCKJIO- 
YeHbI, Tak, HANpuMep, HE HMCCT CMBICIA TOBROPUTh O PaBHOMePHOM pacnpepeennu, BO BCeEM 
N-Me@PHOM eBKAMJOBOM MPOCTpaHcTse, B TO BpeMA, Kak MpPHAOKEHMA TeOPuH BepOATHOCTH 
K (pusnKe, K MHTerpabHOM reoMeTpuu, TeOpuM 4nCeN MT. A. Tpe6yroT paccCMOTpeHuA TaKux 
He HOPMUpyeMbIx pacnpenerenui. BriOupaa B KayeCTBe OCHOBHOTO MOHATHA TeOpun BepoAT- 
HOCTei MOHATHE YCNOBHOM BePOATHOCTH, YNOMAHYTbIM He HOPMMPyeMbIM pacnpeyerenuAm 
MOMHO aTb TOYHDI MaTeMaTHYeCcKHH CMpICI. Hopad Teopua e1aeT BOSMO>KHBIM ooobmlenne 
wenoro pxaga TeOpeM TeOpHu BEPOATHOCTEM M HOBbIe MPHIOKEHMA TEOPUN ; padora 3aHuMa- 
eTCA paspaOoTKOM HOBOM TeOpun HM 3HAKOMUT C HEKOTOPEIMH €¢ THIMUHEIME NpuOKeHHAMH. 
Teopua ucxoquT m3 Ciefyouynx NpeAVOAOXKeHUM M AKCHOM : 

Hycrp S ecTb m1000€ MHOXKECTBO, KOTOPOe MbI OyAeM HasblBaTbh MpocTpaHCTBOM 
Cco6bITHH ; MycTb | eCTb o-anreOpa MOAMHOKEeCTR MpOocTpaHcrTBa S, anementst @] MbI Oyjem 
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Ha3bIBaTb COOBITHAMH ; TYCTb JR CCTb HEKOTOPOe HE MyCTOE MOAMHOXKECTBO OT G (SB ecTb 
MHOKeCTBO BCex ONycTHMbIx ycaoBun), a P(A|B) tpyHkuns MHOKECTB OT ABYX MepeMCH— 
HbIX, ONpemetennaa, ecn AEC u BE BB; yncao P(A|B) mpi GyfeM Ha3bIBaTh yCOBHOK 
BEPOATHOCThIO COObITHA A OTHOCHTeIbHO YCIOBNA B. UpegnonoKuM, 4TO BbINOAHAWTCA 


cnenyroume 3 akCHOMBI : 

Axcuoma I. P(A|B)=0, ecan AEG u BER, u P(B|B)=—1, ecan Bée SB. 

Axcuoma Il. Eco BE tbuxcuporan, P(A|B) ectb mepa ua o-anreope C1. 

Axcuoma III. Ecan AEG, BEd, CER u BCE, to 

P(A|BC) P(B|C) = P(AB|C). 

Ecan axcnomp I—lIl BpinomHeHHBI, TO COBOKyNHOCTh MHOxeCcTBa S, o-anredpEl 
CUCTeMBI MHOKeCTB Qu (byHkunH MHOxKecTB P(A|B) HasoBem npoctrpaHCTBOM yCAOBHOIt 
BeposTHocTn u O6o3Ha4HM Yepes [S, , B, PI]. 

Ouesuguo, uto ecan B duxcupoganno, To S, ¢| u P(A|B) odpasyror no teopnn 
A. H. Konmoroposa npoctparcrso pepostHoctu. [loatomy npocrpanctBoO ycCAOBHON 
BEPOATHOCTH ABIACTCA HM 4M HHbIM, KAK COBOKYMHOCTbIO OObIKHOBEHHbIX MPOCTPaHCTB BepOsAT- 
HOCTH, CBASAHHBIX akcnomon III. 

B xayecrre HenocpeACTBeHHOrTO CAeACTBUA aKCHOM TOyYaeTCA paBeHcTBO P(A|B) 
P(AB|B), a noaromy P(A|B) <1. Pasgen 1.4 3anumaeTca fanbHeMWMMH NpOCTBIMH Caep- 
cTBHSIMM axcuom. B pasfene 1.5 uccneayerca np KaKHX YCOBHAX YCIOBHAS BePOATHOCTH 
Q(AB) 
Q(B) 
OorpaHu4eHHan) Ha o-anredpe (| u Q(B) >O0 ann BES. Ucuepnpinarouree uccneqornanne 
aToro Bompoca, a TakwKe CHeAyiomero OOnee OOuerO BOMpOca: B KaKOM Cayyae yCuOBHas 


P(A|B) moxer ObiTb mpep”cranjena B Bue P(A|B) , rae Q mepa (He O6si3aTeMbHO 


BepostHocth P(A|B) moet ObiTb mpenctapnena B Bufe P(A|B)————— ,rne mepa Qe 


BbIOUPaeTCA HS HEKOTOPOrO MHOKeCTRA Mep B 3aBHCHMOCTH OT B, MO%*KHO HaliTH B paooTe 
A. Yacapa [13]. B pasgene 1.6 uccaenyioTcsa Cayyalinble BeAMYUHbI, OMpeAeNeHHbIe B 
NpOCTpaHCTRe yCOBHOM BePOATHOCTH, HM COMepKUT ONPeAeneHne ux (byHKUNM pacnpeseneHust 
nu (pyHkunH mOTHOCTH. 

Dynxunto §—§(s) (SES) Mbi HaspipaemM CayYaHOK BeAMYMHON, ecan OHA UsMeEpUMa 
oTHOCHTebHO €{. Monorouno neyOpipatoulyio uM CaeRa HenpeppiBnyro (byHKuuIO F(x) Mpr 
Hasbipaem (OOOOMeHHON) (pyHKuMel pacnpesenenns Cry4aiHOH BeAMUHHDI §, CCAM MHOKECTBO, 
re a S(s) <6, npunaniexur sb, npeanonaras, uro F(b)—F(a) >0, u B atom cnyyae 

P(cx§&<dlaxé< bd) FFG ecw axScedsb. 

PynkunA pacnpeyxenenua F(x) He Onpeyemena OAHOSHAYHO, MOTOMY 4TO BMeCTe C 
F(x) onpeyenennto yxosnetsopser nu AF(x)+- 4, rae 2>O uw Bemecrsenno; cbyHKuns 
pacnpenenenusa F(x) MOOKeET NPMHUMATh sMO6HIe BeULeCTReHHBIe (3HauNT HW OTPHuATeAbHBIe) 
sHauenna. Ecan F(x) aOcomorno wenpeppisna, dyHkunio f(x) = F’ (x) Hasonem O606ueHHON 


(byHkunen MIOTHOCTH CayyaiHon BeaMunHbI £; (pyHKUN NAOTHOCTH ONpemeneHa AM C 


+@ 

TOYHOCTHIO LO MOAOKUTEAbHOrO TOCTOAHHOFO COMHOKUTES UH | F(x) dx ne o6s8aTenbHO 
oo 

cyusecrayer. Ecan, 8 yacrnoctu, f(x) = 1(—20 <x < +- »), TO MBI roBopuM, 4TO cayyan- 


Hasl BeMYHHA § PaBHOMEPHO pacnpefenena Ha BCe BeEMeECTBeEHHOW OCH. Pasyzen 1.7 sannma- 
eTca OMHOM NepetpopmyaupoBKon aKcuompr Ill. B pasgene 1.8 paccmatpnraetcs pacuimpenne 
NpocTpaHcTB ycHOBHO! BepoxTHOcTH, B&B 1.9 — HeNpepbIBHOCTh ycnoBKOM BeposTHOCTH, 
B 1.10 — onpegenenne npouspejennsa npocrpanctr ycnoBHoit BepontHoctn. Pasnenbi 2.1 u 
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2.2 cofepoxKaT NpuMepbI NOCTpoeHua NpoOcTpaHcTR yCAOBHOM BeposATHOCTH, B paspenax 2.3 
u 2.4 usyyaroTCA NpOCTpaHCTBa yCAOBHOM BePOATHOCTH, OONaMalOUMe HEKOTOPHIMM JONONHN- 
TeIbHBIMH CBOMCTBAMM: TaK HasbiBaemMble MpoctpancrBa Kaganbepu vu peryApHpie mpo- 
cTpauctga. Pasyen 2.5 paccmatpupaet napagoxc Bopeaa, 2.6 — pacnpepenenne CyMMbI 
He3aBUCHMBIX CIYYaUHbIX BeMYNH WH KOMMO3MINMIO BBEACHHBIX B pasf~ene 1.6 OGOOMeHHBIX 
¢pyHkuuH pacnpefenennu. B § 3 Ha HECKOABKNX MpUMepax NMOKasbIBaeTCA, KAK HOBAA TeOpnsi 
NPUBOANT K OTKPHITHIO HEKOTOPbIX HOBBIX COOTHOIWEHHM, KOTOPbIe B PaMKax OOBINHOK TeOpuH 
BeEPOATHOCTH He MOryT ObITh cbOpMysupoBaHHb!. Paspzen 3.6 copepsKuT OOOOMIeHMe MeTOMAa 
Boauca. Pasgzen 3.7 cosepxuT onpefenenne ycuoBHOM sprosM4HOCTH OTHOCHTeABHO Were 
Mapkora. B pasyene 3.8 paccmarpuBpaerca OfMH MapasoKc TeOpuu BOsOOHOBAeHUA. Pasyzen 
3.9 cofepKuT mnpocroe u ucxofaujee us OOnee NApOcTbIxX 4eM OObINHO nNpesznon0- 
KEHHM AOKasaTembcTBO 3aKOHa Makcpenna O pacnpefenennu cKOpocTev, ucnomb3sys| WaHHoe 
B pasfene 3. 6 O606uleHne MeTona Banca. B § 4 peyb uper 06 ycnoBHbIx 3akOHax OOMbUIMX 
uuCcel, OTHOCALIMXCH K CXOMMMOCTM C BeposATHOCTHIO | ycnOBHOrO cpefAHero HaOsmrOpeHMM. 
B xayectse npwioKenun pasgzen 4.3 conepoxuT o606ujeHne TeopemE! Hopes, OTHOCS- 
WenCA K HOPMAMbHbIM PasIOKEHHAM B ACCATHYHBIC APOOU, Ha psxEr Kanropa. 
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SUR 23 STRUCTURE DES ESPACES DE PROBABILITE 
CONDITIONNELLE 


Par 
AKOS CSASZAR (Budapest) 


(Présenté par A. Rény1) 


1. Comme généralisation de la notion d’espace de probabilité, notion 
due a A. Ko_mocororr, M. A. RENyI vient de définir les espaces de proba- 
bilité conditionnelle [1,2] par les axiomes suivants: 

Soit S un ensemble donné, soit 4 un o-corps des sous-ensembles de S 
qui contient l'ensemble S (c’est-a-dire une famille des sous-ensembles de S 
qui contient S et, en outre, la différence de deux ensembles quelconques et 
la réunion d’une suite dénombrable quelconque d’ensembles qui appartien- 
nent a elle), et soit ® une famille non vide qui fait partie de 4. Supposons 
qu’a tout couple d’ensembles A, B, oti A€ A et BE &, correspond un nombre 
réel P(A|B) et que les conditions suivantes sont remplies: 


I. P(A|B) 20 et P(B|B)=1 pour Aca, BES. 
AI. Pour BE & fixé, P(A|B) est une fonction o-additive de l'ensemble 


Aé 4, cest-d-dire que l'on a pour A= >) Ax, A,€ A (kK=1,2,...), Ai Ar= 
k=1 
=—0 (== 4) 
P(A|B) = > P(A, |B). 
jaf 


Ill. On a pour AEA, BEA, CER, BCER 
ESS ie P(AISC)P(BiC)—P (ABC). 


Il est aisé de constater qu’on arrive a un espace de probabilité condi- 
‘tionnelle en considérant une mesure « définie sur C (c’est-a-dire une fonc- 
tion non-négative et o-additive de l'ensemble A€ 4, qui peut aussi prendre 
des valeurs infinies) telle que tout ensemble B¢ sé ait une mesure positive et 
finie et en posant 

_u(AB) 

“(B) 

De facon plus générale, soit {a} une famille de mesures definies sur Cnet 
dont les indices forment un ensemble ordonné, et supposons que, pour e@ < , 
ua(A)<-+ ce implique ug(A)—0. S’il correspond a tout ensemble B ¢ H une 
mesure ja telle que 0 < ue(B) <+ ce (il ne peut y avoir qu’une seule mesure 


P(A|B) — 
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de ce type) et si Von pose 
| Ua(AB) 
P(A Bb) ee a Pam Gs)) © 


on arrive a un espace de probabilité conditionnelle (pour la démonstration, 
voir [1], p. 381 ou [2], p. 305). 

En considérant les exemples mentionnés, la question se pose, quelles 
sont les conditions qu’un espace de probabilité conditionnelle doit remplir 
pour qu’il posséde une structure plus ou moins semblable a celle des exemp- 
les en question. Pour pouvoir formuler d’une fagon précise ces questions, 
convenons de la terminologie suivante: nous dirons qu’une famille {ta} de 
mesures engendre un espace de probabilité conditionnelle donné, si a) cha- 
cune des mesures u, est définie sur G, b) a tout ensemble & € & correspond 
au moins un indice @ tel que O<ua(B)<+o, c).on a pour ACA, BER, 


(1. 2) 0 < pa(B)<+ 0 
l’égalité 

— &e(AB) 
(1. 3) P(A|B) == By 


(l’inégalité (1.2) peut étre remplie pour plusieurs indices @, mais |’égalité 
(1.3) doit étre valable pour chacun de ces indices). Nous dirons qu’une 
famille {u.} de mesures définies sur un o-corps Cl est ordonnée suivant la 
dimension, si les indices {@} forment un ensemble ordonné et si A€d, 
Ma(A)<+~, «< implique ug(A)=0. 

En employant la terminologie que nous venons d’introduire, le but de 
cet ouvrage peut se formuler de la fagon suivante: examiner les conditions 
nécessaires et suffisantes de ce qu'un espace de probabilité conditionnelle 
puisse ¢tre engendré par une famille de mesures quelconque, de ce qu’il 
puisse étre engendré par une famille de mesures ordonnée suivant la dimen-_ 
sion, et de ce qu'il puisse étre engendré par une famille de mesures compo- 
sce d’une seule mesure (en ce cas nous dirons que l’espace est engendré 
par cette mesure). Nous allons donner la réponse a ces questions principales” 
et nous trouverons quelques résultats complémentaires concernant la structure 
des espaces de probabilité conditionnelle. 


2. Dans ce qui suit, nous supposerons toujours qu’un ensemble S, un 
o-corps Cl des sous-ensembles de S qui contient l'ensemble S et une famille - 
non vide CQ sont donnés et qu’une fonction réelle de deux ensembles 
P(A|B) est détinie pour A€ A, BEX. Un systeme [S, 4, 8, P] de ce type et 
satisfaisant aux axiomes I, II et III sera appelé espace de probabilité condi- 
tionnelle. 

On a la proposition suivante: 

(2.1) En admettant les axiomes | et Ul, Ul équivaut ad ensemble des 
conditions 
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IIl,. P(A|B) —P(AB|B) pour ACA, BEB 


5 et 


Ill,. On a pour ACBCC, AEA, BER, CER 
(2. 2) P(A|B) P(B|C) = P(A|C). 

DEMONSTRATION. a) Supposons que III est valable et posons Ba=C 
dans (1.1) pour A€A,BEX. On obtient P(A|B) P(B|B) = P(AB|B), ce 
qui donne d’aprés | la condition III,. Considérons ensuite des ensembles 
ACBCC,AEA, BER, CER, et appliquons la formule (1. 1), on arrive a 
ois, (Cf, [1], p. 373 et [2], p. 291.) 

b) En supposant que les conditions III, et III, sont remplies, considé- 
tons des ensembles A,B et C tels que AE, BEA, CER et BCE; on 
aura en vertu de ABCC BCCC 


P(A|BC) P(B|C) = P(ABC|BC) P(BC|C) = P(ABC|C) = P(AB|C), 

- donc Ill est valable. 

En généralisant la notion d’espace de probabilité conditionnelle, nous 
_ appellerons espace général de probabilité conditionnelle un systeme [S, A, &, P] 
du type envisagé plus haut et satisfaisant aux conditions I, II et IIl,. Nous 
_dirons qu’un espace général de probabilité conditionnelle [S, C1, %, P] est 
_engendré par une famille {u,.} de mesures, si 

a) chacune des mesures ta est définie sur Q, 

b) a tout ensemble BER correspond au moins un indice @ tel que 
(0<u(B)<+, 

c) on a pour AEA, BER, O<ua(B)< + légalité 

Ua(A B) 

Ma(B) | 

(2.3) Un ensemble S, un o-corps Q des sous-ensembles de S tel que 
S€A, une famille non vide ®8CA et,une famille {va} de mesures deéfinies 
sur & étant donnés, pour que la famille {ua} engendre un espace général de 
probabilité conditionnelle [S,A, 8, P], il faut et il suffit que les conditions 
a), b) et d) soient remplies, oi d) désigne la condition suivante : 

d) Pour A€A, BER, ACB, ta(B)<-+ 0%, ue(B)< +c on a 
(2. 4) ta (A) H p(B) = H(A) Ha (B). 

DEMONSTRATION. Les conditions a) et b) étant nécessaires par deéfini- 
tion, pour que la famille {va} engendre un espace genéral de probabilité 
conditionnelle, il faut encore que la formule 
Ua(AB) 

Ua(B) 


définisse la fonction P(A|B) univoquement, c’est-a-dire qu’on ait pour A€ d, 


P(4|B) — 


P(A|B) = 


8 Acta Mathematica VI/3—4 
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BéE&, 0< ta(B) < + 7, 0< up(B) < + 


ta(AB) — #p(AB) | 
(Ze) Ua(B) u3(B) . 


(2.4) est la conséquence de (2.5) pour A€dl, BE R, ACB, si 0< u.(B)< 
<+0,0<yup(B)<+o. Or, Si #e(B) =O ou si wg(B)=0, on a encore 
Ua(A) =0 ou t(A)=—0, selon le cas, donc (2.4) est valable en ce cas aussi 
et la nécessité de la condition d) est établie. 

Réciproquement, si a), b) et d) se vérifient, l’égalité (2.5) étant la con- 
séquence de (2.4), la fonction P(A|B) est définie univoquement par la for- 
mule de la condition c) et on constate sans peine qu’elle satisfait aux axio- 
mes I, II et Ill. 

(2.6) Si lespace général de probabilité conditionnelle [S, A, &, P| est en- 
gendré par une famille {u.} de mesures, il est un espace de probabilité con- 
ditionnelle (c’est-a-dire il remplit laxiome Ill). 

DEMONSTRATION. II correspond par hypothése a tout ensemble B € 3 au 
moins un indice @ tel que O< ua(B)<-}+ ~, et on a pour ACA 
Ha(AB) 

Malis) 

Soit ACBcC,AEd, BER, CER. Si P(B|\C)=—90, on a d’aprés | et Il 
0= P(A|C) = P(B|C)=0, donc (2.2) est valable. Si P(B|C)>0, soit « 
un indice tel que 0 < w#e(C)<-+ %; on a alors 
Me(BC) _— a(B) — 
aC) aC)” 


P(A|B) = 


P(B\C)— 
donc 0< «a(B) < +, et 


Ua(AB) a(6) — Ua(A) UAC) 
P(A|B) P(B|C) — i648) tel 5) __ HelA) _ is 
eee YS ie BY S teal ets (Gants) 
done (2.2) est valable en ce cas aussi. 

On a la réciproque suivante de (2. 6): 


0, 


—=P(A|C), 


(2.7) Tout espace de probabilité conditionnelle [S,A, %, P| peut étre 
engendré par une famille de mesures. 


DEMONSTRATION. Définissons la mesure u,(A) pour AE, BEX de la 

facon suivante: 
P(A\B our ACB, 
1p (A) =| ( | ) p 
| + 00 pour A—B-=-0. 

On voit aisément d’aprés | et II que (A) est une mesure sur et que «n(B) — 
—P(B|B)—1 pour BE &, donc que les conditions a) et b) sont remplies. 
Pour démontrer la validité de la condition c), soit B € &, B’ € &,0 < un (B) < 
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<-F oe. On a alors BCB’ et P(B|B’)=«uy(B), donc d’aprés III, et IIL, 
P(AB |B’) up (AB) 
P(A|B) = P(AB|B) = i! 
(A| B) — P(AB|B) P(BIB?) y(B) 
pour A€a quelconque, ce qu’il fallait démontrer. 


En résumant (2.5) et (2.6), on peut donner la réponse suivante a la 
premiére question principale: 


(2.8) Pour qu’un espace général de probabilité conditionnelle puisse étre 
engendré par une famille de mesures, il faut et il suffit qu’il soit un espace 
de probabilité conditionnelle (c’est-d-dire qu’il remplisse ’'axiome IIl,). 


3. Nos résultats précédents montrent que tout espace de probabilité con- 
ditionnelle [S, , 8, P] peut étre engendré par une famille de mesures, mais 
Vanalyse de la démonstration montre que la puissance de cette famille peut 
€tre tres élevée, jusqu’a étre égale a la puissance de la famille 38. La ques- 
tion se pose, quelles sont les conditions qui permettent de diminuer le nombre 
des mesures qui sont nécessaires 4 engendrer un espace de probabilité con- 
ditionnelle donné, ou au moins de diminuer le nombre des différentes va- 
leurs des mesures d’un méme ensemble A €¢l. Dans cet ordre d’idées, nous 
allons déterminer la condition nécessaire et suffisante de ce qu’un espace de 
probabilité conditionnelle [S, 4, 8, P] puisse étre engendré par une famille 
{ua} de mesures de facon que, pour un ensemble A€d donné, la valeur 
fla(A) ne prenne au plus que les valeurs 0, + oo et une.seule valeur finie et 
positive. Dans cette condition, et dans plusieurs autres conditions qui vont 
Suivre, le role principal sera joué par la formule 


(3.1) [P(A B) = [] P(AI Bin) 
pour 
(3. 2) A; ‘< é,, B; € B, A; CB; Bias (i == 1h Beaty Us B= B;): 


Introduisons l’axiome suivant: 

IV). (3. 2) entraine (3.1) pourvu que Pun et Pautre membres de (3.1) 
soient positifs. 

On a alors la proposition suivante : 

(3.3) Si espace de probabilité conditionnelle [S,A, %,P] peut étre en- 
—gendré par une famille {a} de mesures de facon que A€ A,0< ue(A)< +, 
0 < u(A) < + 00 entraine tta(A) = up(A), cet espace satisfait a IV,. 

DEMONSTRATION. En supposant que les ensembles A; et 6; satisfont a 
(3. 2) et que I’un et l’autre membres de (3. 1) sont positifs, et en choisissant 
les indices @; de facon que l’on ait O< “a,(Bi)<+.~, on a 

tta,(Ai) tag (Ad) 


“Ha (Bs) ’ P(A;| Bit1) = = 1: 


P(A,|B) = 
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donc 0 < ta,(Ai) < + 2,0 < He;,,(Ai) << + e° pour i=1,..., 2, @ni =. Tl 
s’ensuit be (Ad) = sea: on a par consequent 


n Tf 1A) Hf Ma; (Aa) a, 
(3.4) [f[PA|_)= === He TT PCAN Ra: 


ve c=4 


T] 0B) ili tas.4(Bis) 


done (3.1) est valable. 
Dans les démonstrations qui vont suivre, les notions suivantes nous 


serons utiles: [S, 4, %, P] étant un espace général de probabilité condition- 
nelle, nous dirons que la suite finie B,,...,B, (6; €) forme une chaine, 
si ona 

P(B;Bint|Bi) >0, P(B:Bis|Bi) >0 (=1).02; eee 
Nous définissons pour les ensembles de la famille 3 une relation d’équiva- 
lence B~ B’ en appelant équivalents les ensembles BEB et BES, s'il 
existe une chaine B,,..., B, telle que B,—B et B,—B. Le caractére sya 
métrique et transitif de cette relation est évident et sa réflexivité s’ensuit de 
l’axiome I, en particulier de la relation P(B|B)—1>0. 

La proposition suivante fournit la réciproque de (3. 3): 


(3.5) Si Pespace de probabilité conditionnelle [S, A, 8%, P]_ satisfait a 
Paxiome IV,, il peut étre engendré par une famille {ua} de mesures de fagon 
que A€A,0< ua(A) < + 0,0 < ug(A) <+ 9 entraine ta(A) = up(A). 

DEMONSTRATION. Rangeons les ensembles de & dans des classes d’aprés 
la relation d’équivalence introduite et formons une famille SCH qui a avec 
chacune de ces classes un élément commun et un seul. 

Nous définissons pour B € 3B la mesure #x(A) (A € A) comme suit: pour 
A—B=-0 posons uz(A)=+ ~, et pour ACB, soit EC 8, E~ B, soit E= 
== 8,,...,B,=B une chaine et posons 
: ry P(BBia|B)) 

(3. 6) tt, (A) = P(A|B) Lee, Boa|Baa)’ 

Pour justifier cette définition, il faut démontrer que la valeur de u,(A) est 
indépendante du choix particulier de la chaine qui relie E a B. Ceci étant 
evident si P(A|B)—0, on peut supposer que P(A|B) > 0. Nous démontrons 
en ce cas un peu plus, a savoir que si E—B,...,B,,—B'DA est une 
autre chaine et que si P(A|B’)>0, on a up(A)= ey (A). En effet, en ce cas 


B= Bn, Bn-1,..., Bj = E=B,,B,,...,B,—=B est une chaine’ elle aussiy 
donc en vertu de IV, 


n-1 


P(A|B!) ii P(Bi Bi Bi) I P(B, Bis1| Bis) = 


n-1 


- P(B;. Bi.1|Bi HT P(B;B;,1|B;)-P(A|B), 


(3.7) 
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Yun et l’autre membres étant positifs par hypothése; il s’ensuit 


| fage le Bi Bi ps 1] 


Ceci établi, wp est évidemment une mesure sur a. ‘Si Aé€d, 
O< up(A)< +0, 0<up(A)< +, ona ACB, ACB’ et P(A|B)>0, 
P(A|B’)>0, done a fortiori P(BB’|B)>0, P(BB’|B’)>0, de sorte que 
B, B’ est une chaine, 8~ B’, et d’aprés ce que nous venons de démontrer, 
* ona {tp(A) = Up: (A). 
La famille {«,} jouit donc de la propriété affirmée dans l’énoncé. II faut 
encore démontrer qu’elle engendre l’espace [S, 1, 8, P]. Or, on a pour BER 


i P(B:Bis|B) — 77 P(BBaslB, 
Alb PCB) Mpeg A peB.B a 


donc 0< up(B)< + -~ et, pour A€ 4 quelconque, 


(AB 
P(A|B) — P(AB|B) — = ae 
Enfin, si O< up (B)< +~, BES, ona 
te(AB) un(AB) uy (BY) erica tl ee 
Pm By eae PUB). 


en vertu de IIl,, ce qui était encore a démontrer. 
En résumant (3.3) et (3.5), on peut dire: 


(3.9) L’axiome IV, fournit la condition nécessaire et suffisante de ce 
— qu’un espace de probabilité conditionnelle [S, A, %, P] puisse étre engendré 
par une famille {ua de mesures de facon que A€A, O<uc(A)< +>, 
0 < uwg(A) < +. entraine Ua(A) = up(A). 
4. L’axiome IV, assure donc |’existence d’une famille {ue} de mesures 
_ telle qu’elle engendre l’espace de probabilité conditionnelle [S, Cl, 8, P] et que 
A€ A, 0< ua(A) < +00, 0< ug(A)< +c entraine t.(A) = m,(A). On voit 
-cependant (cf. § 7) que les conditions en question n’impliquent pas que te 
et wg coincident sur tout ensemble A’é€ a, A’cA. Pour pouvoir formuler la 
condition qui entraine cette proposition plus forte, convenons de la définition 
suivante: [S,,&,P] étant un espace général de probabilité conditionnelle, 
nous dirons que la suite finie B,,..., B, (B) € B) forme un cycle, si Yon a 


P(B;B;41| Bi) Aw) P(B; Bi+1| Biss) =) (i= Ly Avene tls Bay == B)). 
Introduisons l’axiome suivant: 
IV,. (3 2) entraine (3.1) pourvu que B,,..., By soit un cycle. 


On a la proposition suivante: 
(4.1) En admettant les axiomes I, Il et Tl, IV. entraine Ill, et 1V,. 
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DEMONSTRATION. Soit AEA, BER, CER, ACBCC. L’égalite 
_P(A|B) P(B|C)=P(A|C) 
étant valable au cas ott l’on a P(8\C)—O (donc a fortiori P(A|C)— 


d’aprés I et II), on peut supposer que P(B|C)>0. En ce cas, les nee 
B et C forment un cycle, on a donc en vertu de IV, et I 


P(A|B) P(B|C) == P(A|C) P(B|B) = P(A|C), 
Vaxiome III, est donc valable. 
Soit ensuite A;¢€ @, B,€ &, A; cB Bay (t=-1,..:,.n; Bayi) ets 
posons que les nombres 


[[P(A\B) et [[P(A\B.s) 


sont positifs. Il s’ensuit que P(B;Aii|B;) >O et que P(B;Bii| Bi) >0 
(i=1,...;), donc) que’ By,.2.4-8, est un cycley don Ton a\d apreseams 
Pégalité (3 1), de sorte que IV, est, lui aussi, valable. 

Le réle de l’axiome IV, est mis en évidence par la proposition suivante: 


(4.2) L’axiome \V, fournit la condition nécessaire et suffisante de ce 
que lespace de probabilité conditionnelle [S,A, 3, P|] puisse étre engendré 
par une famille {ua} de mesures de facon que A€A, O<ua(A)< +x, 
O < us(A) < + c¢ entraine wa(A’)="s(A’) pour A’ Ed, A’CA. 

DEMONSTRATION. Neécessité. Si {ua} est une famille de mesures du type 
en question qui engendre l’espace [S, 4,3, P], soit B,,...,B, un cycle et 
soit A;€d, A;C Bi Bir (i =1,...,2; Basi—B,). On a alors pour des indices 
«; convenables 0 < ua,(B)) < 4+-o, donc 


Me (B;Bi1) Ma; (B; Bi.1) 
se > 0. PIB Aa ee ) 
Ha; (Bi) ( ee Ha;, (Bist) 


OU Gis a. Il s’ensuit Me(Ai) = ue, (Ai) et par conséquent l’égalité (3. 4) 
est valable, ce qui montre la validité de IV,. 

Suffisance. Supposons que l’axiome IV, est rempli dans l’espace de 
probabilité conditionnelle [S, A, 8, P]. D’aprés (4.1), il en est de méme quant 
a l’axiome IV,, de sorte qu’en définissant up, (A) comme dans la démonstra- 
tion de (3.5), on obtient une famille {u,} de mesures qui engendre l’espace 
[S, A, B, P]. Si AEA, O< we(A)< +0, O<un(A)< +x, AED, A'CA, 
on a ACBB et 


P(B; Bi41| Bi) : Se O, 


ttn (A) 
un(B) 


done les ensembles 6B et B’ forment un cycle, de sorte que 
P(A’ B) P(BB’ |B’) — P(A’ B’) P(BB’ |B) 


Halla 
u es (B’) ¢ QO, 


P(BB’|B) = P(A\B) ~0, P(BB'|B’) = P(A B’)- 
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en vertu de IV.. On en conclut que les nombres P(A’|B) et P(A’|B’) ou 
bien s’annulent l’un et l’autre, ou bien sont positifs. On a dans le premier 
cas 
Un (A) =P(A’|B) «a(B)=0, un (A’)=P(A'|B) un (BY) = 0, 
dans le second us(A’) >0, ux (A’)>0 et d’aprés la démonstration de (3. 5), 
10;(A’) = wn (A’). En tout cas, la famille {uz} posséde la propriété affirmée. 
Les propositions (2.1), (2.6), (4.1) et (4.2) se résument comme suit: 
(4 3) Pour qu’un espace général de probabilité conditionnelle [S, A, &, P| 
puisse étre engendré par une famille {ua} de mesures de facon que A€A, 
O< wa(A)< +0, O0<pp(A)< +00 entraine ua(A’)—=wup(A’) pour A’ € a, 
A'C A, il faut et il suffit que cet espace remplisse ’axiome I>. 


5. Passons a la question des espaces de probabilité conditionnelle 
engendrés par des familles de mesures ordonnées suivant la dimension. 
L’existence d’une famille génératrice de ce type sera assurée par l’axiome 
suivant: 

IV.,. Les conditions (3.2) entrainent légalité (3.1). 

L’axiome IV. implique évidemment IV.,, donc (en admettant I, II et IIl,) 
pit, et IV, 

La nécessité de IV, est exprimée par la proposition suivante: 

(5.1) Si lespace de probabilité conditionnelle [S,Q, 3, P] peut étre 
engendré par une famille {a} de mesures ordonnée suivant la dimension, cet 
espace satisfait a IV;. 

DEMONSTRATION. Soit B;E€ 8, Ai€d, A: CB Bir, O< Ma(Bi)< + & 
f= 1, 13 Bysi= Bi). Il faut démontrer qu’on a 


= Ma;(Ai) “ Maz .4 (Ai) = 
5. 2) Le = ie Wh (Busy (ti) 


i=l i=) 


Cette égalité étant évidemment valable si Pun et autre numérateurs contien- 
‘nent chacun au moins un facteur qui sannule, supposons qu’on a par 
exemple gto,(A;) >0-G=— I, ..<; 1). @iwaeec Osa @; == Ce POUL. 1 155..5/1, 
puisqu’autrement on aurait (t«,,,(Ai)—= +c pour au moins une valeur de 
Pindice i. Il s’ensuit que @, = @ S--+ S@n =a, donc que a= a@,—=--- =p 
et que par conséquent («,(Ai) = Ha,,,(Ai), de sorte que (5. 2) est valable. 

La démonstration de la réciproque de la proposition (5.1) sera un peu 
plus compliquée. Elle fera usage de ta notion et du résultat suivants: E et E’ 
‘étant deux ensembles partiellement ordonnés, considérons une transformation 
f(x) qui fait correspondre a tout élément x€F un élément X= f(x) € EB" 
La transformation f(x) sera dite strictement isotone, si V'inégalite x < y entraine 
toujours celle f(x) <f(y). En faisant usage du théoreme du bon ordre, on 
peut démontrer que tout ensemble partiellement ordonne peut étre transformé 
par une transformation strictement tsotone en un ensemble (complétement) 
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ordonné. En effet, on sait qu’on peut définir dans tout ensemble partiellement 
ordonné un ordre complet de facon que si la relation x <y était valable 
d’aprés l’ordre partiel, elle reste valable d’aprés lordre complet (v. p. ex. 
[3]). En désignant par E l’ensemble partiellement ordonné en question et par 
E’ le méme ensemble pourvu de l’ordre complet dont nous venons de par- 
ler, la transformation f(x)—.x fournit une transformation du type envisage. 
Nous pouvons maintenant démontrer la réciproque suivante de (5. 1): 


(5.3) Si Pespace de probabilité conditionnelle [S,A, %,P] satisfait a 
laxiome 1V;, il peut étre engendré par une famille de mesures ordonnée 
suivant la dimension. 


DEMONSTRATION. La suite finie B,,...,B, (B;€ 3) sera appelée chaine 
ascendante si lon a P(B;Biii|B) >O pour i=1,...,n—1, mais légalité 
P(B;Bi1|Bist) 0 est valable pour au moins un indice 7<n. Nous in- 
troduisons un ordre partiel dans la famille 3 en convenant de ce que la 
relation B < B’ est valable pour deux ensembles BE &, B’ € &, si et seulement 
s’il existe une chaine ascendante B,,...,B, telle que B=B8,,B’=—B,. Les 
inégalités B< B’ et B’< B” entrainent évidemment celle B< B” et B<B est 
impossible, car si B= B,,...,B,—B était une chaine ascendante, le produit 


L/P (B:Bis'\Bi) (01 Buys = B,) devrait tre positif (puisque P(B,B,..|B,) — 
to! 


—P(B\B)>0), tandis que celui //P(B;B:1|B:) serait zéro, se qui con- 
a | 


tredit a IV. On obtient donc en réalité un ordre partiel dans &. 
Remarquons que 


(5. 4) les hypotheses ACEO, BES, B’ ER, AC BB’, P(A|B) > 0, P(A'B’)—0 
impliquent B < B’. 


En effet, on a d’aprés IV, 
P(A|B) P(BB’| B’) = P(A|B’) P(BB’ B), 


done P(BB’| B’)—0, tandis que P(BB’|B) = P(A|B) > 0, de sorte que B, B’ 
est une chaine ascendante. 

L’ordre partiel que nous venons d’introduire dans S& est compatible 
avec la relation d’équivalence introduite pius haut. En effet, si ona B< B’ 
B*~ B,B" ~ B’, soit B=B,,...,B,—B’ une chaine ascendante et soient 
B* = Bi,...,Br=B et B’=B;,..., Bi —=B™ des chaines, la suite finie 
BY =Bi,..., Bun =B=B,,..., B, = B= By’,..., By =B™ sera évidemment. 
une chaine ascendante, on aura donc B* < B™. 

En désignant donc par {S,} la famille des classes d’équivalence corres- 
pondant a la relation que nous avons introduite, on peut définir un ordre 
partiel dans l'ensemble {S,} ou, ce qui veut dire la méme chose, dans 
ensemble {a} des indices correspondants, en posant a<6 si et seulement 


SUR LA STRUCTURE DES ESPACES DE PROBABILITE CONDITIONNELLE 347 


s'il y a des ensembles BES, et BCS, tels que B< B’. Vinégalité a<b 
impliquera alors B,<B; pour deux ensembles quelconques B,€§, et Bie §). 
Soit ¢=f(a) une transformation strictement isotone de l’ensemble {a} 
en un ensemble ordonné {@} (nous avons parlé plus haut de la question 
d’existence d’une transformation de ce type). Désignons par Q, la famille des 
ensembles A€C tels qu’il y a un ensemble B pour lequel” ona Ai; 
BE 8a, f(a) Sa. 
Puisque l’axiome IV, entraine IV,, on peut définir pour B€ & la mesure 
“p comme dans la démonstration de (3.5); on aura 
(AB) 
un(B) 
pour A€d, BER, etsi AEA, BER, BER, B~B, ACBB,, avec les mémes 
notations que dans la démonstration que nous venons de mentionner, l’axiome 
IV; implique la validité de l’égalité (3.7), donc de celle (3.8). Par conséquent 
(5.5) les hypothéses AC A, AC BB’, BE S§., B’E 8, impliquent wp(A) = 
= y’(A). 
Nous allons définir pour A € @, une fonction d’ensemble y.(A) comme 


P(A|B) — 


suit: 
(5. 6) @a(A)—up(A) si ACB, BE 8, f(a)—a, 
(9::7) a(A) =0 Se BD Cay, J (eC) == < a. 


Pour justifier cette définition, remarquons d’abord que, pour tout ensemble 
A€Qza, au moins une des possibilités (5.6) et (5.7) se réalise. Supposons 
ensuite que les hypothéses de (5. 6) Sont réalisées de deux facons différentes : 

wie BB eo. faye et ACE, B es, fHa')=—e. 
En ce cas, ou bien on a P(BB’|B)—P(BB'|B’)—0, donc P(A|B)= 
—P(A|B’)=0 et par conséquent ws(A)—ue(A)=0, ou bien on a 
P(BB’|B)>0, P(BB’\B’) > 0, donc B~ B’, aa’, et par consequent, d’apres 
(5.5), un(A)—=ur(A), ou bien on a, disons, P(BB'|B) >0, P(BB'|B’) Pe 0, 
' donc, d’aprés (5.4), B< B’,a<a'’, e—f(a)<f(a’) =a, ce qui est impossible. 
Il s’ensuit que la valeur de ga(A) fournie par (5.6) ne dépend pas du choix 
de l'ensemble B. Supposons enfin que les hypotheses de (5.6) et de (5.7) 
sont réalisées en meme temps: 

AcB, BES, faj=a et-AcB’, BCS, f(b)=&< a. 
On a en ce cas “p(A)=0; en effet, si un(A)=P(A|B)ua(B) était positif, 
Vinégalité P(A|B’) > 0 entrainerait B~ B’,a=b, c— f(a) = I (6) = Sad, ce 
qui est impossible, tandis que de l’égalité P(A) B’)—0 sensuivrait d’aprés 
(5.4) B< B’,a<b,a—f(a)<f(b)=<ae, ce qui est également impossible. 
Les formules (5.6) et (5.7) fournissent donc la méme valeur a (A) au cas 
ott les hypothéses de l’une et de l'autre sont remplies. 
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On constate sans peine que les conditions A€d, A°€ Qa, ACA’ 
entrainent A€Q, et ga(A) = Ga(A’), et que la fonction d’ensemble gq est 


@ 
o-additive sur ©,, c’est-a-dire que les hypotheses A — >, Ai, ACOs, Arce 
1 


(i=1,2,..., A:A;=0 (i=_/) impliquent ga(A) = > Ga(Ai). 
1 
Définissons pour XS la mesure extérieure vz par la formule suivante : 


oO 


ve(X)— int > ga(Ai), (0) —0 
xo DA; 
1 
AiE Que 


en convenant d’attribuer la valeur -+ ~ a la borne inférieure d’un ensemble 
vide, c’est-a-dire en posant 7%(X)=-+-~ si l’on ne peut pas couvrir 
l'ensemble X avec une suite dénombrable d’ensembles A; € Qa. On démontre- 
comme d’habitude que 7% est une mesure extérieure, c’est-a-dire qu’on a 


© 


ve(X) =O pour XCS et que 14(X) = » ve(X;) pour XC =X. 
Pour A€Q., ona 7(A)=— aye En effet, en at A avec SOi- 


méme, on obtient v%(A) = ya(A); d’autre part, si AC >) A;, Ai€ Qa, soit 
1 


Aj = AA; — = AA‘. On aura Ai€@ et AicA;, donc Af€ Qa, A=> A; et 
1 
Aj A;=0 (+f, ce qui entraine 


galA)= > gal At) = > ga(Ad- 


Ceci éfant valable pour toute suite dénombrable {A;} qui couvre A, on a 
Pa(A) = Va(A), ce qui était encore a4 démontrer. 


En appelant 1%-mesurable un ensemble ACS si et seulement si l’on a_ 
' pour tout ensemble X cS 


(5. 8) y(X) = vt (XA) + 12(X—A), 


on demontre (v. p. ex. [4], p. 41 a 47) que les ensembles 7%-mesurables 
forment un o-corps et que la fonction 7% est une mesure sur ce o-corps. 
Tout ensemble A€Q est v%-mesurable. En effet, le signe = étant 


> 


toujours valable entre les deux membres de (5.8), soit Xo AeA oe On 
1 


a AKG ae AA: X—A =a (A;— A), AA‘€E A, AA: C Aj, A—A€ A, Ai—ACA,, 
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done AA; € Qa, Ai— A € Qa, et par conséquent, en vertu de Pégalité A; —AA;+ 
pie. A:—A), 


Va(X A) + v5(X—A) < pa; fa(AA;) + Ge (AA): > Pa(Ai), 
i T 


ce qui etant valable pout toute suite dénombrable { A;} qui couvre l’ensemble _X, 
Ve(XA) + ¥6(X—A) S v5(X), 
d’ot' s’ensuit la proposition a démontrer. 
Désignons par v~ la mesure définie sur Q et qui coincide pour A€Q 
avec (A). La famille {v.} de mesures est ordonnée suivant la dimension. 


En effet, soit @< 8, AEA et v(A)<+o. Ona Oe A;€ Qa, donc 
AiC B,, B.€ $a, f(a) =a; = a < ®& Mais les Pantone 
AA: CB;, Bi6Sa5-f(Gi) <2 
entrainent d’aprés (5. 7) que gs(AA,)=-0 (i= 1, 2,...), donc que 14(AA;) —0 
et que 
O = 9(A) = 13(A) = >: v3(AA;) = 0. 


La famille {7.} engendre l’espace de probabilité conditionnelle [S, A, 3%, P]. 
Soit en effet BER, 0O< r(B)< +o. Si BES,, f(b)—-, on a vs(B)= 
— ¥;3(B) = ¢p(B) = un(B), donc 0< ,(B) < + -%, ce qui nest possible que 
si ¢ =f (la famille {v.} étant ordonnée suivant la dimension), on a par 
conséquent pour tout ensemble A € 

3(AB) — a(AB) va(AB) Va(AB) 
iat es ee = = 
(1B) (BY fa(B) (BY) B) 

Nous avons par la démontré le théoréme (5. 3). 

En résumant (5.1) et (5.3), on peut donner la réponse suivante a la 
seconde question principale : 

(5.9) Pour qu'un espace de probabilité conditionnelle puisse étre engendré 
par une famille de mesures ordonnée suivant la dimension, il faut et il suffit 
gue cet espace remplisse laxiome IV;. 

En faisant usage des propositions (2.1), (2.6), (4.1) et (5.9) et en 
observant que IV, entraine IV., on peut encore dire: 

(5.10) Pour qu’un espace général de probabilite conditionnelle" puisse 
étre engendré par une famille de mesures ordonnée suivant la dimension, il 
faut et il suffit que cet espace remplisse Paxiome IV;. 

6. L’analyse de la démonstration de (5. 3) montre que si l’on veut faire 
engendrer un espace de probabilité conditionnelle donné par une famille de 
mesures ordonnée suivant la dimension et se composant d’un nombre aussi 
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petit que possible de mesures différentes, il faut trouver une transformation 
strictement isotone de ensemble partiellement ordonné des classes d’équi- 
valence définies dans & en un ensemble ordonné de puissance aussi petite 
que possible. Dans cet ordre d’idées, il est aisé de demontrer la proposition 
suivante : 


(6.1) Soit X un ensemble partiellement ordonné et supposons quwil y @ 
un nombre naturel N tel que X,<X.< +++ <Xn, xX:€X entraine n= N. Er 
désignant par N, le plus petit des nombres N de ce type, Pensemble X peut 
étre transformé de facon strictement isotone en un ensemble ordonné ayant la 
puissance N). 


DEMONSTRATION. Nous dirons qu’un élément x€ X a le rang n(x), Si 
n(x) est le plus grand nombre naturel n pour lequel il existe des éléments 
xXi€EX tels que xX, <%< +++ <Xn—xX. Par hypothése tout élément x €X 
posséde un rang 1 =n(x)=WN,. En faisant correspondre a x € X le nombre 
y =n(x), on parvient a une transformation strictement isotone de |’ensemble 
X en Y, ott Y désigne l’ensemble {1,2,...,N,)} pourvu de lordre naturel. 
En effet, si x< x’, x€ X, x’ € X, n(x) =y, ily a des éléments x;€ X tels que 
Xy <X_ << -+- << Xy =X; par conséquent x, =< x%,<— -*-< xXy— X, GONG Ai ome 
Syl ea n(x). 

La proposition que nous venons de démontrer permet de donner une 
condition nécessaire et suffisante pour qu’un espace de probabilité condition- 
nelle puisse étre engendré par une famille de mesures ordonnée suivant la 
dimension de puissance finie qui ne dépasse pas un nombre naturel donne. 
Pour pouvoir mieux formuler cette condition, employons la_terminologie 
suivante: B,,...,B8, étant une chaine ascendante dans l’espace de probabilité 
conditionnelle [S, Cl, 8, P] (c’est-a-dire si lon a P(B;B,|B;))>O pour 
i=1,...,n—1, mais si l’égalité P(B;Bis1| Bit) 0 est valable pour au moins. 
un indice 7), nous dirons qu’il y a un saut entre B; et Bis, si Yon a 
P(B;B;,1|B:1)—0; toute chaine ascendante contient donc au moins un saut. 

Voici la condition dont nous venons de parler: 


(6.2) Pour qu’un espace de probabilité conditionnelle [S, A, &, P| puisse 
etre engendré par une famille de mesures ordonnée suivant la dimension et 
composée dun nombre de mesures qui ne dépasse pas le nombre naturel N, 
il faut et il suffit que cet espace remplisse l'axiome IV, et que le nombre des 
sauts ne dépasse le nombre N—1 dans aucune chaine ascendante de lespace. 


DEMONSTRATION. Neécessité. La nécessité de la validité de IV, étant la 
consequence de (5.9), remarquons que si la famille {u.} de mesures est 
ordonnee suivant la dimension et si elle engendre l’espace [S, C, &, P) cies 
conditions Be 8, B’€ 8, P(BB’|B)>0, P(BB’'|B’)=0, 0<4u.(B)< +0 
entrainent t¢(BB’) > 0, us(BB’)=0, done « < Par conséquent s’il y avait 
au moins N sauts dans une chaine ascendante B,,...,8B,, en faisant corres- 
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pondre a tout indice 7 (i= 1,..., 2) une mesure Ma, telle que 0 < tta,(Bi)< +, 
on aurait @, =«@,---=a, et le signe d’inégalité serait valable au moins N 
fois, de sorte que le nombre des indices différents, donc celui des mesures 
différentes, serait au moins N-+1. 


Suffisance. En répétant le raisonnement de la démonstration de {o23); 
on constate que, dans l’ensemble partiellement ordonnée {§,} des classes 
_d’équivalence, le rang d’aucun élément ne dépasse le nombre N. Donec, 
d’aprés (6.1), lV’espace [S,, 8, P] peut étre engendré par une famille de 
mesures ordonnée suivant la dimension et ne contenant que N mesures 
au plus. 

Pour pouvoir répondre a la troisiéme question principale, il ne faut 
_ qu’appliquer la proposition (6.2) au cas N= 1. La condition qu’aucune 
chaine ascendante ne peut contenir que N—1 sauts, veut dire en ce cas 
que, dans l’espace [S, 1, %, P], il n’y a point de chaine ascendante, ou ce 
qui est la méme chose, que les relations P(&B’|B)>0, P(BB’|B’)—0 ne 
peuvent pas étre valables simultanément pour B € 3, B’ € &. Toute famille de 
mesures se composant d’une seule mesure étant ordonnée suivant la dimen- 
sion, on parvient a la proposition suivante qui répond 4a la troisieme question 
principale : 

(6.3) Pour qu’un espace de probabilité conditionnelle [S, A, 3, P| puisse 
étre engendré par une seule mesure, il faut et il suffit qwil remplisse l’axiome 
IV; et que, pour BE ®, B’E XR, on ait ou bien P(BB’|B)—P(BB’'|B’)—0, 
ou bien P(BB'|B)>0, P(BB’|B’) > 0. 

Il est aisé de voir qu’en écrivant, dans (6.2) et (6.3), espace général 
_-de probabilité conditionnelle au lieu d’espace de probabilité conditionnelle, 
les propositions en question restent valables. 

Il faut encore remarquer que l’axiome IV. peut €tre remplacé par IV, 
dans (6.3). En effet, d’une part IV, entraine IV,, de l’autre si, pour BE &, 
B’¢€&, on a ou bien P(BB’|B)=P(B&B'|B’)=0, ou bien P(BB’|B)>0, 
_ P(BB’|B’) >0, les ensembles B,,..., B, (Bi € 8) forment ou bien un cycle, 
ou bien on a pour au moins un indice i P(B;B;1|B;) = P(BiBi1| Bi) —0 
(Bnii—B,) et en ce cas (3.2) entraine évidemment (3. 1). 


| 7. Dans les raisonnements qui précédent, nous avons introduit en dehors 
des axiomes I, II et III, qui servent de fondement les axiomes Tee tae Ve 
et IV,. Nous savons qu’entre ces axiomes les relations logiques suivantes 


subsistent (en admettant toujours I, II et Ill): 
ar IV, 
IV; — ae Een III, Y, 


Nous allons démontrer par des exemples trés simples qu’en dehors des 
implications énumérées aucune n’existe entre les axiomes en question. Dans 
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les exemples qui vont suivre, le symbole £(a,6) désignera la famille des 
sous-ensembles mesurables au sens de Lebesgue de Il’intervalle (a, 6), et |X| 
désignera la mesure de X. 
a) IV, est valable sans que IV, le soit dans l’exemple suivant: 
S=(0, 3), A= (0, 3), B={B,, B,, Bs} o1 B\=(0, 2), B, = (1, 3), Bs=(0, 1)+ 
(2, 3): P(A|B) — 5 |ABi pour. A€ dL et i= 1,2; P(AIB) =1A-2,3)h 
IV. est valable puisque cet espace est engendré par la famille {1,, us, us} 
de mesures ott 
\ |A| pour AcB,, 


u;(A) = } oo pour “Ase Bre 0 (5152) 
et 
_2\1A-(2,3)(5 pour Ac B,, 
1;(A) coe | + 00 pour AB. = 0, 


famille qui satisfait é€videmment aux conditions posées dans le théoréme (4. 2). 
IV, est en défaut puisque 

P(B,B,|B,) P(B,B, B,) P(B;B,| Bs) a 7 : - : O 
tandis que 

] 


ES 
~ 


P(B, B,| B.) P(B,B,| B,) P(B,B,| B,) — - oh 


_ b) IV, est valable sans que IV, le soit dans l’exemple suivant: S— 
{a, b,c}, G est la classe de tous les sous-ensembles de S, R—{C,, Cs}, 


ott C= {a, b} et C,— S; P(A|C) = p(A-{a}), P(AIC) => p(A-{b,¢}), of 


p(X) désigne le nombre des éléments de l'ensemble X. 

IV, est valable, car si (3.2) est rempli et si l’un et l’autre membres de 
(3. 1) sont positifs, on a nécessairement, pour tout indice / tel que @) B;—C,, 
Biyr==C, ou que 8) B= C,, Bur = C,, Végalite As —C,, tandis que pour 
y) B= Bir on a P(A;|B;) = P(A;|B;,1), de sorte qu’on peut supprimer des: 
deux membres de (3.1) les facteurs qui correspondent aux indices i du type 
vy) ce qui donne l’égalité 

P(C,\C,)” P(Ci|.C.)’ = P(C\C,)* P(C,|C,), 
ou @ et # designent le nombre des indices du type @) et de celui #) respec- 
tivement, égalité valable en conséquence de la relation évidente « — 9. Cepen- 
dant IV, est en défaut puisque 
P({a}C) P((b}|C) = 1- > 
et que 
P({a}|C,) P({b} |C,) 0-0. 
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Le méme exemple b) montre que IV, n’entraine pas Ill,: 
1 
1+ = P({a}|C) P(C,|C.) + P({a}|C.) =0. 


c) Ill, est valable sans que IV, le soit dans l’exemple suivant: S = (0573); 
A=€(0,3), B={B,, B} ot B,—(0,2), B.—(1,3); P(A|B,) =+ |AB,|, 
P(A|B.) = | xdx. 

ABy 

La validité de III, est la conséquence de ce que cet espace est engendré 

par la famille {u,, u.} de mesures ov 


| IAI pour AcB,, 
«4 (A)- “[---eo pour A—B,=0 
et 
{ |xdx pour AcB,, 
H(A) == } A 
' + occ pour A—B,=-0. 


On a cependant pour A=(1.5],4=(1, 2) 


a | Diageo 
Fe = PUB) P(A! B) = P(A) P(4d|B:) = 35° 5 - 
d) Ill, et IV, sont valables sans que IV, le soit dans l’exemple suivant : 
S = {a, b, c,d}; G se compose de tous les sous-ensembles de S; B= {D,, D.,\ 


moi D,— {a,b,c} et D,—={b,c,d}; P(A|D,) — 5 p(A-{a, 6}), P(A|D,) = 


—s? (A-{c,d}) ott p(X) désigne de nouveau le nombre des éléments de X- 
III, est valable puisque cet espace est engendré par la famille {u,, Mo} 

de mesures telles que 

(a) Ne (4(0) = I u,(c) is 0, (a) == tes oo, 

u,(a)= +00, u(b)=0, w(C)=—1, w(d)=—1. 
On constate aisément en appliquant (3.3) que IV, est également valable. Tout 
de méme IV, est en défaut: 

1 


J = P({6}|D,) P (fb, €}|D.) += P({O}|D;) P({6, ¢}|D,) 0+ >. 


Les axiomes IV,, IV. et IV; montrent la particularité qu’ils se rapportent 
A un nombre indéterminé d’ensembles de &, tandis que III, ne concerne 
qu’un nombre déterminé d’ensembles. On pourrait se figurer que, peut-étre, 
il suffirait de postuler les axiomes IV,, IV. et IV, pour un nombre déterminé 
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(suffisamment élevé) d’ensembles. Pour etre plus précis, désignons par Ivy 
(k= 1, 2,3; n= 2, 3,...) Vaxiome qui exige que les conditions (3. 2) (et les 
conditions supplémentaires correspondant aux axiomes IV, ou IV; si. kee 
ou 2) entrainent |’égalité (3.1) pour un nombre naturel n donné. Nous allons 
étudier dans ce qui suit les relations d’implication entre les axiomes IIb, 
IV, et IV? (en admettant toujours I, II et IIL). 
On a évidemment 
IV, > IV}? (k= 1, 2,3; n= 2, 32) 
et 
Ve Ivy? (n=2, 3,...), 
tandis que la démonstration de la proposition (4.1) fournit les implications 
Veo Ill cet lVe0 > IV" (n =2, 3, ...). 
Il est aisé de voir que 
Ve iVe 2 (k=1, 2/3; n= 3, 4 
En effet, si ’on a B;€R,A:€4, A:-CBiBius (i =—1,...,n—1; Br —B,) (et si, 
pour k=1, les conditions P(A;|B,) >0, P(A: Bis) >O sont valables pour 
i=1,...,a—l, ou, pour k=—2, si B,,..:., Bas est un cycle), on peut poses 
Bi== Bi pour i=1,..., n9—1, Ba = Bay —B,, Aj = AP pour i= a ae 
et A, —B,. On aura en ce cas en vertu de IV) (méme pour k—1 ou 2) 


1/P(4i\B)— iT P(A} Bi), 


ou ce qui veut dire la méme chose 
n-1 n-l 


[[P(A\B)-P(B,|B) = LI PA,| B:.1)-P(B,|B,), 


i=} <= 
par conséquent IV; ” est valable. 
On a enfin 
Ivy? — IV$?, 
car si B, et B, (B; € &, i= 1, 2) ne forment pas un cycle, on a P(B,8,|B,)=@ 
ou P(B,B,|B,)—0, done pour A;€ A, A:c B,B, (i=1, 2) 
P(A,|B;) P(A,|B:) = P(A,|B,) P(A,| B,) = 0. 
D’aprés ce que nous venons d’établir, le tableau suivant est valable: 
IVs — + +» —> IV$? + IV? 
| { | 
IV, > «+» > IVS? + IVP > Ih. 
| | { 
IV, +++ > IV)? > Iv? 


Nous allons montrer qu’il n’existe pas d’autres relations d’implication | 
entre les axiomes en question. En effet, l’exemple a) montre que IV, n’entraine: 
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pas IV;), l’exemple b) montre que IV, n’implique pas IVs”, l’exemple c) 
montre que III, peut étre valable sans que IV!” le soit, et celui d) montre 
que III, et IV, peuvent étre valables sans que IVS’ le soit. Pour démontrer 
notre proposition, il faut encore montrer que IV}? n’entraine pas IV{''” 
— (n= 2,3,...), ce qui s’ensuit de l’exemple suivant: 


Be Or 0 1) {Cs Cag) ol Ce 
ett ley) dia ly 2, nm), Cacz=—(0, 1)42(n, decal ak PAI) es IA Gi 
RourAea et 7512..<> 4: P(AlCus) = 14-0, +24 - (0,041) 


pour A€d. 
Iv"? est en défaut: 


ae 7 

i : £33 ea P(C, C,| C;) Ly P(C. Coe ta) P(Gax Ci | Cyst) =e 

ne este ie teat 
Bee eC Onis) ee (Ce Gras) Cov) PCr Cri Ci) = ES pres ot 


Pour démontrer que cet espace satisfait 4 IV3’, considérons des ensembles 
A;€0, B:€&, ACB: Ba: (@=1,...,2; Baji=B;).. La formule (3.1) étant 


évidemment valable s’il y a un indice 7 tel que B;B;.;—0, on peut supposer 
qu’on a B;B;.4==0, donc que 
Ci. 1) pe ACH CIne Deny, OL Cm, Ol Cot 


Gs Pe eT Nn; Coen, Gass = C)). 
Pir Cn pour f— ts 5.7, 7, la-formule (3.1) se-réduit; a 


x 7 


(4) ia 


ce qui est valable, de sorte qu’on peut supposer qu’on a B;—C,41 pour au 
moins un indice i. Soient 1=i,<i,<---<i.= 1 les indices de ce type. En 
posant B,—8B,, on a en vertu de (7. 1) 


By 1 a Cay ou (ee ou a (k =| isteley ay 


(i. 2) Si B= Cn (= Tou ny) On GB aC (bi 4). 

En effet, B;,.,-1—= Csi étant impossible d’aprés la definition des i, on 
a By,.4-1—=C, ou C,; mais Vhypothése B;,,,-1== Bi,.1 est impossible, car Si, 
disons, Bj,;:—C, et k<r, on a d’aprés (7.1) Bi,.,.1—=Cn ob mSiu— 
/ _j—i,=n—1 et un raisonnement analogue s’applique au cas ot By.1 = 
=C,, et pour k—r. En tenant compte de ce qu’aux indices 7 tels que -B;—= 
— B;.;—Cy1, correspondent des facteurs egaux dans les produits 


(7. 3) 1[ P(A B) et 11 PAB.) 


(>) Ha 


9 Acta Mathematica V1, 3—4 
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on peut supprimer ces facteurs de l'un et de autre membres de (3.1). En 
désignant par « le nombre des indices 7 tels que B:=C,, Bir=Cnr, par 
8 celui des indices tels que Bj = C,, Bit = Crt, par « celui des indices. 
tels que B; = Cui, Bir —C,, par @’ celui des indices tels que B:=Ca 
Byii—C, et par y le nombre des indices tels que Bi == Ci, Bar == Gee 
les produits (7.3) prennent, aprés avoir supprimé les facteurs dont nous avons 


parlé au commencement, la forme 


4) miai-(3) (a) Ga} (3) 
et 
7.9) iai-(3)-(3) (3) Gy (a) - 


ou on a désigné par TT 'e produit extendu sur les indices que nous n’avons. 
pas supprimés. La proposition (7.2) a pour conséquence que «—«’ et que 
=’, de sorte que les produits (7.4) et (7.5) sont égaux, ce qui était 
encore a démontrer. 


8. Jusqu’ici nous n’avons fait aucune hypothése concernant la structure 
de la famille s8. En introduisant des hypothéses de cette sorte, on peut 
réduire considérablement les conditions d’autre nature. On doit, en particulier, 
a M. A. RENYI la remarque que si la famille 2 est additive’ (c’est-a-dire si 
elle contient avec B, et B, l’ensemble B,-+ B,), ’'axiome IV, est la conséquence 
de |, Il, Ill, e¢ Ill,. De fagon plus générale, soit [S, 4, %,P] un espace de 
probabilité conditionnelle ; nous dirons que la famille 3 est quasi-additive, 
si 4 deux ensembles quelconques B, € & et B,€ B correspond au moins un 
ensemble Bé<B tel que 


(8. 1) B,+BcB et P(B,|B)+P(B,|B)>0; 


un ensemble 6 de ce type sera désigné par B,o B,. Si la famille & est ad- 
ditive, elle est quasi-additive puisque, en posant B,o B,—8B,+B,, les con- 
ditions (8.1) sont valables (on tient compte de ce que P(B,|B,+B,)+ — 
+P(B,|B, “+ B,) = P(B,+B, B,+B,)= 1). 

On démontre alors par un raisonnement analogue a celui de M. A. RENYI 
la proposition 


(8. 2) [S,a, s&, P] étant un espace de probabilité conditionnelle, si la 
famille % est quasi-additive, cet espace satisfait a l'axiome IV. 
DEMONSTRATION. Soient B,,...,B, des ensembles de la famille & et 
posons 
B'=B,, B= Bio Bs, pour i=1,:..,a—1 
et 
ba=B. 
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Eu égard 4 (8.1), ona B'c BY et B,C B* pour i,k=—1,...,n et isk Ega- 
lement d’apres (8.1), on a ou bien P(B,.|B)>0, ou bien P(B""|B)>0; en 
ce cas on a ou bien P(B,-1|B" ye 0, donc en vertu de III, P(8,-41.B) == 
= P(B,-1|B"”) P(B" |B) > 0, ou bien P(B"*|B"")>0, donc P(B"?|B) = 
—P(B"~|B"’) P(B""|B)>0. En poursuivant ce raisonnement, on aboutit 
au resultat qu’au moins une des valeurs P(B;|B) (i—1,..., n) doit étre posi- 
tive. 

Soient maintenant A; (i—1,...,2) des ensembles appartenant a 4 et 
tels que A;C B; Bj: (B,.1—B,). Si au moins un des nombres P(B;|B) s’an- 
nule, on a au moins’ un indice i, tel que P(B;,|B)—0, P(B,.:|B)>0 et 
aussi au moins un indice 7, tel que P(B;,,|B) > 0, P(B,,.:|B)—0, en tenant 
toujours compte de la convention B,,:— B;. On a donc en ce cas d’aprés Iz 

‘pp Dope | ede) > PC; 1B) 

Bette eet) Se EN Bet Bist) = oe 8) =" P(B.alB) 
done P(A;,|B;,,1) =O et on établit de la méme facon l’égalité P(A;,|B;,) =0. 
L’un et l’autre membres de |’égalité 


0, 


3.3) [T P(A: B) = I P(A;| Bis1) 
sannulent donc en ce cas et (8.3) est valable. 
Dauire: part si P(5;\B) > 0° pour 1—1,...,.n, on a en vertu de Ill, 


VL PCA) Pee eeR(A By: 
oes rina, ee PB a:[B),’ 
donc (8.3) se réduit a l’égalité évidente 
7 Fy PAB) 77y_PCAIB) 
pep Hf P(B:i|B) * 


Il s’ensuit de (8.2) et de (5.3) le théoréme suivant: 

(8.4) [S, 4, &, P] étant un espace de probabilité conditionnelle, si la 
famille & est quasi-additive (en particulier, si elle est additive), cet espace 
peut étre engendré par une famille de mesures ordonnée suivant la dimension.' 

Pour mieux formuler le théoréme suivant, convenons de la terminologie 
suivante: [S, A, &, P] et [S, A, &*, P*] étant deux espaces de probabilite con- 
ditionnelle, on dira que le second est un prolongement du premier, si "> & 
et si l’on a pour ACA, BER Végalité P*(A| B) = P(A|B). 

On démontre alors le théoréme 

(8.5) [S, A, 8B, P] étant un espace de probabilité conditionnelle, les pro- 
positions suivantes sont équivalentes : 


1 M. A. Rény1 a donné une démonstration directe de ce théoréme (pour le cas d’une 
famille 3% additive) bien plus simple que celle du théoréme général (5. 3). 


p OF 
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i) [S, A, &, P] satisfait a Paxiome \V,; 

ii) [S, A, &, P] peut étre engendré par une famille de mesures ordonneée 
suivant la dimension ; 

iii) [S, A, B, P] posséde un prolongement [S, A, %*,P*] tel que 3° est 
additive ; 

iv) [S, A, &, P] posséde un prolongement [S, A, 8°, P*] tel que 3” est 
guasi-additive. ; 

DEMONSTRATION. i) entraine ii) d’aprés (5.3); iii) implique iv) puisque 
toute famille additive est quasi-additive; iv) entraine i) car en vertu de (8. 3) 
il s’ensuit de iv) que [S, , &*, P*], et alors a fortiori [S, C1, , P] lui aussi, 
satisfait 4 IV,. Il ne reste donc qu’a démontrer que la proposition iii) est la 
conséquence de ii). 

Pour s’en convaincre, considérons une famille {u} de mesures pata 
suivant la dimension et qui engendre [S, O, %, P]. On peut définir sd° comme 
la famille de tous les ensembles BEC tels qu'il y a au moins un ah « 
pour lequel on a O< Ha(B) < +o (la famille {uv} étant ordonnée suivant la 
dimension, il n’y a qu’un seul indice de ce type) et on peut poser pour 
A€d, BEB 
ta(A B) 

“ta(B) ? 


ou on a désigné par « un indice tel que O<u.(B)<-+- x. En effet, on con- 
state sans peine que les conditions a), b) et d) du théoréme (2. 3) sont rem- 
plies pour ensemble S, le o-corps C, la famille d’ensembles <&* et la famille 
de mesures {qa}. Celles a) et b) étant évidentes, pour vérifier la condition 
d), on remarque que (2.4) est valable pour «=, tandis que pour @< 
Vhypothése ttq@(B) <-+ ~ entraine us(B)=0, donc us(A)—O de sorte que 
(2.4) est valable en ce cas aussi. D’aprés (2.3), la famille {ue! de mesures 
engendre ‘done un espace général de probabilité conditionnelle [S, Q, %*, P*] 
qui est en vertu de (2.6) un espace de probabilité Sena S et qui est 
évidemment un prolongement de [S, C1, &, Pj. Or, si BE &*, B’ € R*, choisis- 
sons les indices ¢ et $de facgon qu’on ait 0 < ua(B) < + ©, 0 < ug(B’) < 4-00 
et supposons pour fixer les idées que « = 6 On a alors ua(B)< + , done 
0 < p(B’) = p(B+ BY) = p(B) +49(B) < +, 
de sorte que B+-B’ € 8". La famille &* est done additive, ce qui était en- 
core a démontrer. 


Considérons maintenant la condition suivante par rapport a l’espace de. 
probabilité conditionnelle [S, Q, 8, P]: 


P*(A|B) — 


(8.6) A deux ensembles quelconques B,€ &, B, € &, correspond au moins: 
un ensemble BE & tel que B,+-B,<B et que 


P(B,|B)>0, P(B,|B)>0. 
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On a alors la proposition suivante : 


(8. 7) [S, A, 8, P] étant un espace de probabilité conditionnelle qui satis- 
fait a la condition (8.6), cet espace peut étre engendré par une seule mesure. 
DEMONSTRATION. La condition (8.6) entraine évidemment la quasi-addi- 
tivité de la famille &, l’axiome IV, se vérifie donc en vertu de (Ge2)a,.et 
B, étant des ensembles quelconques de & et B étant l’ensemble qui leur 
correspond d’aprés (8.6), on a en vertu de III, 
P(B, B,|B) P(B, B,|B) 
ES) Se sy ee eae etl aes 
P(B, B,|B;) P(B, B) et P(B,B,|B,) P(B,)B) ’ 
de sorte qu’ou bien P(B8,B,|B;)—P(B,B,|B:)—=0, ou bien P(B,B,|B,) > 0, 
P(B,B,|B,) > 0. La proposition a établir s’ensuit donc de (6. 3). 
Le théoréme (8.7) a pour conséquence presque immédiate le théoréme 
suivant di a M. A. Reny! ({1], p. 375 et [2], p. 292): 
(8.8) [S, A, &, P] etant un espace .de probabilité conditionnelle, s’il existe 
une suite C,,C,,.C.,... telle que 
GoGo G...,G-ed (r—0,1,2,...), 
eee (Ca Cp ae O (Fa 0 152, 0...) 
3. a tout ensemble B€ & correspond au moins un C, tel que BCC, et 
gue P(B|C,) >0, 
cet espace peut étre engendré par une seule mesure. 


DEMONSTRATION. On a d’aprés III], pour r<s 
P(C,| C;) Pic | GC) a P(C,| Gay 
donc, en vertu de la condition 2, P(C,|C,) >0. Il s’ensuit également d’aprés 
Mi; que si BCC, et si P(B|C,) >0, on a pour r<s 
P(BIC,) P(C,| CG.) =P(6[e,), 
donc P(B|C,) >0. On constate alors en faisant usage de 1 et de 3 que la 
condition (8.6) se vérifie en posant B—C, pour un indice r suffisamment 
élevé, de sorte que (8.7) fournit la proposition a démontrer. 
On démontre enfin le théoréme suivant: 
(8.9) [S, A, %, P] étant un espace de probabilité conditionnelle, les deux 
propositions suivantes sont équivalentes : 
i) [S, A, &, P] peut étre engendré par une seule mesure ; 
ii) [S, A, B, P] posséde un prolongement [S, A, &*, P*}] gui satisfait a la 
condition (8.6) (en y substituant 2° a 3 et P* a P). 
DEMONSTRATION. ii) implique d’aprés (8.7) que [S, A, 38", P"), et alors 
[S, A, &, P] lui aussi, peut etre engendré par une seule mesure. Réciproque- 
ment si [S, 4, 2B, P] est engendré par la mesure «, en définissant é8" comme 
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a famille des ensembles B€ 4 tels que O<«(B)<-+~% et en posant pour 
A€d, BES 
(AB) 
u(B) 
on constate tout comme dans la démonstration de (8.5) que [S, A, x", P*] 
est un espace de probabilité conditionnelle et qu'il est un prolongement de 
[S, A, &, P]. Si B, € &*, B,€ R", on a en posant B= B,+ B,- 

0< «(B,) = u(B, + B,) = u(B)) + u(B:) < +, 
donc BES et 


P*(A|B)= 


u u(B, 
P*(6,|B)— 4) > 0, Pr(B,\B)— Se 


de sorte que [S, d, &, P*] satisfait a la condition (8.6), ce qu'il fallait 
démontrer. 


> 
= , 


9. Remarquons encore que si l’on remplace l’hypothése que (| est un 
o-corps par celle que 4 est un corps (c’est-a-dire. une famille d’ensembles 
qui contient la réunion et la différence de deux ensembles quelconques qui 
_ appartiennent a elle) et que si l’on substitue a l’axiome II l’axiome II, sui- 
vant : 


I[,. Pour BEB fixé, P(A|B) est une fonction additive de [ensemble 
A€éd, cest-d-dire que lon a pour A=A,+ As, AxEA ( 
P(A|B) = P(A, |B) + P(A,| 8), 


tous les résultats du présent article restent valables avec des modifications: 
évidentes. En particulier, il faut alors remplacer les mesures par des foncti- 
ons non-négatives et additives d’ensemble. 


(Recu le 17 aotit 1955.) 
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O CTPYKTYPE MPOCTPAHCTB YCJOBHOM BEPOATHOCTU 
A. “acap (Byganeumr) 


(Pest Me) 


Nycrb S nexoropoe mHOxKecTBO, (—o-anre6pa, cocroauee 13 HEKOTOPbIX NOJ- 
MHOKECTB MHOKeCTBAa S, Aanee nycTb SQ HeKOTOPOe HeNycTOe NOAMHOKeCTBO OT JH 
P(A|B)—ynkuua mHoxKecte, onpegenennas ja wcex AE , BE Q; aa9 KoToporo BpmonHsA- 
IOTCA Cefyroune yCNOBHH : 

Il. Econ AEG, BES, To P(A|B)=0 u P(B|B)—1. 

Il. pu duxcuposannom BE § P(A|B) cyerno-app~ntusno na o-anreope 4. 

Ill. Eom AEG, BEG, CER, BCE R, to P(A|BC) P(B|C)—P(AB|C). B stom 
cayuae cuctema [S, €, 3, P] Haspipaerca mpoctpaHcTBOM yCAOBHOI BeEpOATHOCTH. 

Ilyctb {a} HeKOTOpad CHCTeEMAa Mep, ONPefeneHHad Ha o-anredpe | u npeqnonoKum 
4uTO WIA KaxKorO MHOKecTBa BE SB HapeTcA NO KpanHeM Mepe OfUH HHAeKC & TAKOH, 4TO 
0 < wa(B)< + co m AAA BCex TaKMxX @ MANA KaKAOTO MHOMKeCTBa AE uMeeT. MeCTO 


paBeHCTBO 
“a(AB) 
“a(B) 

B 3TOM cnyyae roropsit, 4uTO cucTema {#a} mpeycTrapnaer mpocTpaHCTBO yCaOBHOM 
sepostuocmn [S, O, &, P]. 

Hactosujaa pa6ora paer HeOGxO~MMOe uM AOCTaTOUHOe ycmOBNe AA TOrO, YTOObI 
IpocTpaHcTBo ycnoBHonw BepostHoctTH [S, €, QB, P] Mooxer ObiTh npepctasneHo cucTemMamnu 
Mep OnpefenenHoro Tuna. B yactuoctu, pa6ota sannmaeTCaA TakMuMM CHCTeMaMH {Mea}, Y 
KOTOPbIX “a@(A) mpm dpuKcupoBanHom A € €| MOxKeT NpHHAMaTb — KpoMe 3HayeHHsA O uM --oc— 
TOAbKO CAMHCTBEHHOE KOHEYHOR MOMOKUTeEMbHOe 3HayeHHe. JJanee paccCMaTpuBaeTCA Cryuail 
JIMMCH3NOHAIbHO yNOpsAOUeHHbIX CHCTEM MEP; CHCTeEMA {fa} HASbIBACTCA [MMCH3HOHANbHO 
YNOPAMOYeHHOM, ECAH MHOXKECTRO MBJEKCOB G@—ynOpsfOYeHHOe MHOXKECTBO M M3 @ < / 
ta (A) < -++ co caepyet, uTO #,(A)=0. Padora paeT TawxKe ycnoRMA AAA mpeACraBuMocTH 
MpOcTpaHCTBa YCAOBHOM BEPOATHOCTH JMMCH3HOHAIbHO YNOPAAOYEHHO! KOHEYHOM CHCTeMbI 
Mep, B 4aCTHOCTH yCOBMe MpesACTAaBMMOCTH eAMHCTBeEHHOH Mepoil. Tlog_poOuo uccaepyercs un 
BONpOC HesaBucuMOCTH ymoTpeOseHHBIX yCNOBHi. 


P(A|B) — 
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ON STOCHASTIC PROCESSES CONNECTED WITH CERTAIN 
PHYSICAL RECORDING APPARATUSES 


By 
L. TAKACS (Budapest) 
(Presented by A. Rényi) 


§ 1. Introduction 


In our paper [4] we have considered the following stochastic process : 

Let us consider a Poisson process in the moments ¢ (0=f< ). Let 
the temporal density of the events be a non-negative, continuous and bounded 
function A(¢) of ¢. We suppose that each event of the Poisson process gener- 
ates a signal (a random pulse) with the temporal progress 


ye ee Sit ye), 
( ) f(u, va) = lo if 


where w denotes the time passed since the beginning of the signal; y, the 
amplitude of the signal, is a positive random variable and « is a positive 
constant. Let the random variable 7(f) denote, in the moment ¢, the sum of 
the values of the signals beginning in the time interval (0, f), i.e. 

(2) n= 2. Atty my), 


Si, 0 


it), 


where 0 =¢, <it4,<---<¢, <--- are the moments in which signals are beginning 
m the interval O=t<co and 4%, %,...,%n,-.. are the amplitudes of. these 
signals. We suppose that 7,, 7,... are equidistributed independent random 
variables with the common distribution function P(y, = x)= H(x). In [4] we 
have proved the following theorem : 

M(t, ), the characteristic function of the random variable 1(t), has the 


form ; 


(3) Dt, o) = E {ee} = exp —|ac¢—a)fl —g(me*)| du 
i) : 


where (m) denotes the characteristic function of the random variable 
Van = les 2 Sac >), ile ee 


(4) plo) —E fees} = | ee dH (2). 
0 


Moreover, in the case of temporal homogeneity of the underlying 
Poisson process (i.e. if 2(¢)==4 constant) we have shown that the following 


theorem holds: 


364 L. TAKACS 


If the random variables x, (n= 1,2,...) have a finite expectation, then 
the limiting distribution lim P(j(t) = x)~— F*(x) exists. The characteristic 
t+>o 


function *() of the distribution function F*(x) is given by 


1 
et ee 2 f1A—¢(wa) : 
(5) (p* () = exp |— = | ? on : 


In the present paper we shall deal with a more general case. We suppose 
that the time differences t,—t,1—§ 1 (n=1,2,...;t,—=0) between the 
consecutive events in the underlying process are mutually independent non- 
negative random variables with the same distribution function P(<, = x) = G(x) 
where G(x) is arbitrary; G(O)<1. Again we suppose that the temporal course 
of the generated signals is described by the function (1). Let »(t) denote the 
sum of the values of the signals beginning in the interval (O, t) at the moment 
t; this is given again by (2). Let P(7(t) = x) = F(t, x) denote the distribution 
function of 7(t). In our present paper we shall not deal with the explicit 
determination of F(t, x); we are interested merely in the behaviour of the distri- 
bution function F(t, x) when t> x. 


The process 7(¢) describes a Markov process only in the special case 
when the sequence {¢,} forms a Poisson process. However, in the general 
case it is true that the moments ¢, are the regeneration points of the process. 
Let us write 7(¢,—0)—~7, and P(7, = x)=—F,(x). Then the sequence {7,} 
forms a Markov process also in the general case. 

In particular, if G(x) = 1—e™", i.e. the underlying process is a Poisson 
process homogeneous in time, then lim F(t, x) F*(x) exists as mentioned 

i - to 


above. In case of an arbitrary distribution function G(x), the existence of a 
limiting distribution lim F(t, x)= F*(x) and the determination of F*(x) will 
to 


be treated in § 3. First we shall examine the convergence of the sequence 
(F,(x)} of distribution functions. § 2 contains the determination of the 
limiting distribution function lim F,(x) = F(x). Then the determination of the 


limiting distribution function F*(x) will be reduced to that of F(x). 

It is possible to give an other definition of the limiting distribution 
function F"(x). Suppose that the investigated process 7(¢) lasts since an 
infinitely long time. In this process we choose a moment ¢* “at random” and 
ask the value of P(7(¢") = x). Precisely, by this we understand, that we select 
in the interval (0, ¢) a uniformly distributed random point, then determine the 
probability in question for this random point and take the limit for t—> ~. 
We shall establish the equality P(n(t*) = x) —F*(x). However, this latter 
interpretation of F*(x) seems to be more general than the preceding one; 
actually, the distribution function F*(x) so defined may exist also in cases 
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when lim F(t, x) does not. F*(x) may be regarded as the distribution func- 


tion of the equilibrium state. 


Finally, in § 4 and § 5 we shall deal with the application of the above 
processes to some problems occurring in the theory of counters. 


§ 2. Determination of the limiting distribution 


As it has been said, 7(¢) means in the moment f, the sum of the sig- 
nals beginning in the time interval (0, ¢); the course of »(t) may be seen in 
Fig. 1. Let 7(¢,—0O)—7,, i.e. the value of the sum of the signals imme- 
diately before the beginning of the n-th signal. If the amplitude of the n-th 
signal equals y,,, then 7(¢,)— +z; henceforth, 7(¢) decreases exponentially 
until the moment when the next signal occurs, and we have 


(6) Tn (1x + yn)e-%n 


where the random variables y, and §&, are independent of each other and 
of 7,. Consequently, the sequence {7),} of random variables forms a Markov 
process. In other words, the moments ¢, are the regeneration points of the 
investigated process of non-Markov type. 


ibe 


Fig. 1 


By (6), for the Markov process {7,}, we have the following transition 
probabilities: 


(1) P(tns = x|m»—=Y) =| H(xe—y)dGu) (n= 1,2...) 
0 


as P(y, = x)=H(x) and P(E, = x)= G(x). 

With the aid of (7), starting from PQ, = x) = F(x), (where F,(x) = 
if x =O and F,(x)=0 if x <0) we can determine the distribution functions 
P(n, = x)= F,(x) successively. The computations may be made convenient 
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with the aid of the following recurrence formulae : 


(8) K(x) = | F.(x—y) dH) 
and 
(9) Fuss (x)— | K,(xet") dG(u). 


Here we have K,,(x)=P(y(t,+0) =x), i.e. the distribution function 
of the sum of the values of the signals immediately after.the beginning of 
the n-th signal. 

Relation (6) seems to be extremely suitable for the determination of the 
moments of the random variables 7,,, provided that they exist. By (6) we have 


k : 
IC ~ak€ : k Ps | 
(10) E{ Nest \ ae Exe Men E{ Qh + yn) \ = = Bi. 2 (*| Es Nn} Maj 
where 
ee hm Blew} — Jed) 
and 


Taking the equations (10) for k—1,2,... and n—1,2,..., we obtain a 
recurrence formula for the determination of the sequence of moments, E{ } 
In particular, for M, = E{7,,} we have 


(1 3) M,, Lh (M,, + “) Je “a G(x), 


provided that up, < ~. 


ao 
As | e“"dG(x) <1, the sequence {M,,} converges and 


0 


u Je sl Hd we a 
(14) M lim M,=—_—° 


n> © 


@ 


1— | e-“dG(x) 


0 


ReEMaRK. If the limits lim E{9/}— E; (71, 2,...) exist, then they can 


i—> © 


be successively determined by the equations 


obtained from (10). 


3 "4 Ex uj-x | Bj 


k 
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Especially, E,—M and 


Hise w+ 6)+o°1—&) 3 
v4 (1 — 6) — 6) Aaa 
and the moments of higher order can be determined in a similar way. 
Now let us turn our attention to the following question: Under what 


conditions does the limiting distribution lim Fa(X) ==7"(x)cexist-and how can 


_ it be obtained ? Here we prove the following 


THEOREM 1. /f y, (n= 1, 2,...) have a finite expectation E{ Wn = and 
G(O) <1, then the sequence {F,(x)} of distribution functions converges to the 
same limiting distribution function F(x), independently of the starting distri- 
bution function F(x), as ntends to infinity. This F(x) is the unique solution 
of the integral equation 


je) 


(16) F(x) =| K(x, y)dF(y) 
where | 
(17) | K(x, 9) — | H(xe*—y)dG(u) 


PROOF. first, as-betore, let’7, == 0, ies #4 (x) ==1 if x2 0 and F.(x)=—0 
if x <0. We state that the sequence {F,,(x)} decreases monotonically if x is 
fixed. By a repeated application of (6) we easily obtain 


(18) Nn a=. Aestint n=’) =e oe Heat -tén—2) ot. + yn ye wn (n =2,3,.. » 
Applying (18) for 7,.1, we are led to 

(19) Fa = Kae OE rte ten) Nn 

_ where 7, represents the sum of the other terms; it is easy to see that the 
distribution functions of the random variables 7), and 1, are the same. The 
first term in the right-hand side of (19) is a positive random variable, hence 
we have P(qa11 =X) =P(jnSX), i.e. Fois(X) SFi(X) 2 = 2, 3,...), as stated. 
_ The sequence {F,(x)} is bounded from below (F,,(x) = 0) and is monotoni- 
cally decreasing, therefore the function lim F,(x) — F(x) exists for alent (X)As 


nm —> 


a distribution function. In fact, since F(0)—0O, and it is a non-decreasing 
“function of x, we have only to prove F(~)—1. By (13) the sequence 
M,=0, M,, M;,... of the expectations E{7,} is monotonically increasing and 
converges to a limit M defined by (15). Let x > M/e where «> 0 is arbitrary. 
Then we have also x>M,/s, and, by the well-known Markov inequality 
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concerning non-negative random variables, we obtain F,,(x) = 1—e for all n. 
Hence, for x > M/e we have F(x) = 1—s, i.e. lim F(x) = 1, as stated. 
HY Hoar a @.9) 


Next we prove that the distribution function F(x) is independent of the 
starting distribution. Up to now we have taken 7,,—-0; now, if we suppose 7) 
is an arbitrary random variable, then the sum of the values of the signals 
immediately before the occurrence of the n-th event will be given by 7, 
+n, exp (—e@(§, +--+: +§,-1)) instead of 7). If n increases, the random variable 
7, exp (—e@(&, + ---+§,-1)) converges in probability to 0; therefore a limit- 
ing distribution function exists and agrees with F(x) obtained previously. 

In this case the distribution function F(x) has to satisfy the following 
integral equation: 


(20) F(x) = | P(tinss S x|2» = y)dF(Y) 
which is equivalent to (16). This fact can be easily established. 

Moreover, the integral equation (16) has a unique solution which is a 
distribution function and is the sought limiting distribution function F(x). 
Indeed, if there were another solution, also a distribution function in x, then 
we could take it as the distribution function of 7,. By virtue of equation (6) 
and the integral equation (16), this distribution function reproduces itself step 
by step; and so the limiting distribution itself agrees with it. However, we 
have seen that any distribution function leads always to the same limiting 
distribution function F(x) independently of the initial distribution function. This 
contradiction proves the assertion. 

We note that the integral equation (16) is equivalent to the following 
system of integral equations: 


oo 


(21) K(x) — | F(x—y) dH(y) 
and . : 
(22) F(x) =| K(xe”) dG()). 


Here K(x) = lim P(y), + 7, =x), i.e. the limiting distribution function 


of 7(¢), if ¢ tends to infinity through the values ¢—Tf,, +0. 

Moreover, we note that if at least one of the random variables xn and &,, 
has a non-degenerated distribution, then also the limiting distribution function 
F(x) is a non-degenerated one. 
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§ 3. Determination of the distribution function To) 


: Here we shall answer the following question: What are the conditions 
of the existence of the limiting distribution function jim Pi ajar (s) and 


how can it be obtained? We prove the following theorem : 


THEOREM 2. /f y,, and &, have finite expectations E(y,) = « and E(&,) = 9, 
furthermore, for the distribution function G(x) of &, we have G(0) <1, and 
G(x) is not equal to a distribution function which increases only in Jumps at 
some integer multiples of a certain number, — then there exists a uniquely 
determined limiting distribution function lim F(t, xX) = F*(x). This is independent 


of the starting distribution F (0, x) and “Ge be obtained from 
(23) Fz Ll K(wenyft —G(u)] du 
0 


where K(x) is given by (21). 

We remark that by definition (2) we have 7(0)==0, i.e. F(0O, x)= 1 if 
x=0 and F(0,x)=—0 if x <0. If we suppose that 7(0) = where 7 is an 
arbitrary random variable, then in the definition (2) of 7(¢t) we must have 
also an additive term 7,e“*. 

We introduce a new random variable £(¢) as follows: If in the interval 
(O,¢) some event occurs at all, then let C(t) be the difference between the 
moment ¢ and the moment of the preceding event; in the contrary case let 
C(t)—t. The process C(t) so defined agrees with a special case of the 
renewal process investigated by J. L. Doos [2]. Under the conditions of our 
theorem we can make use of Theorem 12 of Doo stating that the limiting 
distribution function . 

(24) G(x) = lim P(E) =) = = J—G@)]au 
578 0 
exists. 

If in the interval (0,¢) there occur n events and ¢—t,—u, then under 

these conditions let Ki(xe«") be the distribution function of (¢). Introducing 


the notation P(¢(t) = uv)—G(t,u), the conditional distribution function of 
7(t) relative to the occurrence of n events in the interval (0,7) may be given by 


t 
(25) | Ki@e) d, GU, u). 
0) 


Remark that if ft ~, then G(t,u)—G*(u) and no with probability ifs 
In this case, under the conditions expressed, Kn(xe*") > K(xe*"). Using the 
well-known theorem of E. HELLY we obtain 


(26) F*(x) = lim F(t, x) — | K (xe) dG*(u) 


QO 
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with probability 1, and this is what we intended to prove. (It agrees with (23).) 
The uniqueness and the independence from the starting distribution is a 
consequence of Theorem 1. 

If we interprete F*(x) as the distribution function of the random variable 
n(t*), when the process 7(f) is going on since an infinitely long time and f° 
is a moment chosen “at random”, then F*(x) is given again by (23). However, 
we must emphasize that, in view of the latter interpretation, for &, we have 


only the restriction that the expected value E(5,)—.% be positive and finite. 
If the limiting distribution lim F(t, x) exists, then it evidently coincides with 
t> oo 


F*(x). However, F*(x) may also exist when F(t, x) has no limit. 

In order to prove our latter statement, first we have to determine the 
probability that the distance between a point, chosen “at random” in the 
process going on since an infinitely long time, and the moment of the pre- 
ceding event is =x. This probability is given by the distribution function 
G*(x) defined in (24); in fact, this is trivially true if the conditions of 
Theorem 2 are fulfilled, however, by the aid of the strong law of large 
numbers, we can establish its. validity under the assumption O< 4%< x. 
The probability mentioned above will be determined as follows. First, let us 
consider the process in the time interval (¢;, ¢,.:). In this interval we choose 
a point and suppose that it is uniformly distributed in (t, f,.1). We determine 
the probability sought for this interval, then by taking the limit n— ~ we 
obtain the solution of the problem. But it is easily seen that we obtain the 
same result if we take arbitrary intervals (0O,¢) instead of (4, t,.1) and then 
let f+ oo. In fact, if n events occur in the interval (0, ¢), then (t,,:—t)t—1 
with probability 1 as t> ~. 

Now let us consider the interval (41, f..1) and let &;,,§;,,..., &;,, be those 
among the distances €,6,...,§ which exceed x. A point chosen at random 
will have a distance less than x from the preceding event when it lies either 
in an interval of length &,<x or in the left part of the length x of an interval 
longer than x. Under these conditions the sought probability will be given by 


V Vm Si a is Si ) 
a oe = Ce *) m awe pus: | 
(27) nner e Tabi as et rs 5 eer 
No N é ii -+» +6, 


since a uniform distribution was assumed. 

For values x with G(x)—1 (i.e. the length of each interval is = x) 
this probability equals 1; consequently, G*(x)—1, in accordance with (24). 
Suppose now G(x) <1. If #=E(&) (k=O, 1, 2,...), ie. 


(28) 9 = | xdG(x) = |[1— G(x] dx 


0) 
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is finite, then by the strong law of large numbers we have 


(29) lim Si Sn =k. 


> © Tl 


with probability 1. Similarly with probability 1 we have 


30 i Si, Sees Ste 2 (hee es ee 1 " ; 
(30) Jim es E(ER\S, =x) Pac; | udG(w) 
as 
eee ees G(u)— G(x) 
31 P(é,. = c, > X) => — : 
(31) (&, = u|&, > x) G(x) 
and finally 
(32) lim — —1—G(a), 


By making use of these relations, we obtain from (27) 

(33) G(x) 4 Jf1—Gw)jau. 

As the formula (33) gives a correct result also for x with G(x)—1, therefore 
this completes the proof. 

In case of a process going on since an infinitely long time, a uniformely 
distributed point chosen “at random” will be with probability 1 farther from 
the origin than any previously given long time. Thus, in the moment f,, of 
the event preceding the random point, the probability P(7)(¢,—0) = x) will 
be the limiting distribution F(x) with probability 1. Since the distribution 
function of the distance between this ¢, and the random point is equal to 
G*(x), consequently, the probability that in a random point 7(¢t*) =x holds, 
will be given by 


1 a 
(34) PW=% | K(xe*")[1 —G(u) ]du 
was) 
where, knowing F(x), K(x) may be got by (21). F*(x) agrees with the limiting 
- distribution lim F(/, x) provided this exists at all. 
t+>o 


Let M* denote the mean value of F*(x). By (29) we have 


M ae u 
i= 


u 


Jeet — G(u)|du=—. 
0 


ad 


(35) M? = | xd F*(x) =- 
0 


Here M is given by (15). 
REMARK 1. Let E* denote the j-th moment of F"(x). If £7 exists, then 
by (23) we have 


rere 1 ls 
(36) Bs bp, jeg 


10 Acta Mathematica VI/3—4 
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where E; was defined earlier and we used the following relation 


a 
ole?! 


(37) ple “if1—G(x)]dx = a ne 


In particular, for Be M* we have 


_M 1—f, ie 


Me oes ee 


and for-£; 
E: - o : we 1 = B, 
Ee Vg Fa 2a ae 
REMARK. 2. If G(x)==1—e-"%, i.e. ¢,’s are the moments of the events 
occurring in a Poisson process characterized by the density 41/4, then 


I—GQ) _ oy, 
yrs tit? 
and so by (22) and (23) we get 
ES (he Coke 


§ 4. Determination of some expectations 


Applying the stochastic process 7(t) investigated by us for physical 
problems, the following problem arises. Suppose that the process is going on 
since an infinitely long time, i.e. we have an equilibrium state. We ask in 
an interval of length ¢ chosen ‘at random” the average number, of the 
moments in which 7(u) passes a fixed threshold a, i.e. (u—0O)=a, but 
yi(u-+-0)>a — further, for the mean value of the time duration in which 
n(u) >a. Let m*(t, a) and c*(¢, a) denote the former and the latter expectations, 
respectively. 

A passing through the threshold a occurs only in moments where a 
signal is beginning. An easy calculation for the expected number of the sig- 
nals occurring during the time ¢ gives t/%. A signal starting in the moment 
represents also a threshold-passing when before the signal 7(u—0O) =a holds 
and after it 7(u-+-0) >a. The probability of this event is F(@)—K(a), hence 


(38) m*(t, a) — HAG bets (a)]t_ 


The mean value of the sum of the lengths of the intervals lying in the interval 
of length ¢ in which (wu) >a, is easily obtained by 
(39) v(t, a) =[1—F'*(a)]t. 


The expectations (38) and (39) surely exist EsOes we suppose that 0 < 4 < ce 
and wu is finite. 
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If we define these expectations for an arbitrary interval of length ¢ of 
a process going on for an infinitely long time, then we must suppose also 
the fulfilment of the conditions of Theorem 2, namely ima y(t) exists with 


probability 1 if these conditions are satisfied. 


§ 5. Some examples from experimental physics 


In our paper [4] we have mentioned as example the case of particle- 
counting by means of an electron multiplier. If we are counting particles 
arriving according to a Poisson process with the density 2, then the moments 
of the voltage impulses served by the electron multiplier form also a Poisson 
process. So we can apply the discussions given in [4]. But if we lead the 
pulses into a scaling circuit which registrates every m-j-1-st pulse only, then 
the starting points of the voltage pulses obtained in this way form no longer 
a Poisson process. Here the distances between the starting points of two 
consecutive pulses will have the distribution function 


e : Fi )\” 
(40) G(x) = Je 1 OOF a dy. 


In this case we can apply the discussion given above with #—(m-+1)/d. 

The following case is also interesting: we count particles arriving 
according to a Poisson process by a Geiger—Miiller counter. Here the moments 
of the voltage impulses generated by the Geiger—Miiller counter do not form 
a Poisson process. If the inoperative time + of the Geiger—Miiller tube is 
constant, then the distribution function of the distances between the conse- 
cutive voltage impulses is given by 

\ 0 ike X= TC, 

«a GO= |; owen it xB 
Here #—+7-+1/2. In this case we can again apply the discussion given 
previously. 

If we know the distribistion function A(x) of the values of voltage 
pulses, and the distribution function G(x) of the distances between the 
moments of the pulses, furthermore, if we can suppose that the pulses. are 
decreasing in time exponentially with a time constant RC (i.e. ¢=1/RC), 
then the present discussion may be applied. 

In [4] we have considered the case when the voltage pulses have been 
led into an amplifier with the threshold voltage @ and we have got impulses. 
only when the input voltage jumped to a value exceeding a. If we call the 
density of the yee EE in the amplifier as the real pulse density 
(in our case it is 4= 1/9), then we can ask: what will the counter connected 


10* 
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with the amplifier indicate? Let us call it the apparent density of the everts 
and denote by /’(a). It depends on the value of tne threshold voltage a. 
By (38) we obtain 
(42) A’ (a)! A = F(a)—K(a) 
where K(x) is given by (21). Then we must determine only F(x). It can be 
obtained by solving the integral equation (16). 

In the sequel we give some examples for the determination of F(x) by 
which the apparent density of events can be calculated. 

We limit ourselves to the special case when y, = (constant). Then 
by (21) we have 


(43) K(x) = F(x—p2) 

whence 

(44) A’ (a), A = F(a)— F(a—). 
The integral equation to be solved is 

(45) FOjye | F(xe— sd GQ). 


Or, taking into account the equation 


(46) K(x, y) 1—G| + tog sa ‘y 
we can write it in the following form equivalent to the preceeding one: 
(47) Veh 3)" | K(x, y) dF(y). 

Case | 


i 


then by (40) 


@ 


. am+1 x a mm 
F(x)- aed Th aa vf a mae, Retin) f adi 
(ees Eicet ay aie Ady mba | frat \l0g is dt= 
(49) ) 
m+1. A‘a x 

A x m J my “F(t ; 

m! en po Gan) t "| (log x) ec ma —") (log ty dt. 
Let 

a t— 

Ad, C= i ) (log t)' dt (Je Olas slay 


‘ia rm 
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then (49) can be written as 


ft 
stl A/a XN 


P raat yn m a | (log (t+ 
61) FQ =T ASS Ay" (™) dog." | — [Fe Pear 


By the aid of this formula we can obtain F(x) for the intervals (ku, (K+ 1)e) 
{k —0, 1, 2,...) successively. The constants C,,C,,..., C,, may be determined 
from the equations (50) on using the requirement F(~)=— 1. 


Case 2. Especially, if m—0O, then G(x)—1—e*” and we have a 
process generated by a Poisson one dealt with in [4] in details. Here we 
obtain the recurrence formula 


(a an aE 


for the determination of F(x). The constant C, may be determined from the 
requirement F(co) = 1. 

If we know the constant C, in advance, then by (52) starting from the 
representation 


(52) P(x) =- 


(53) bor rae . (0: Xe pe) 

we should be able to present See in an explicit form for the intervals 
(uw, 2u), (21, 3), ... successively. Here we give the following determination 
a1. Cy. 


In our work [4] we have determined the characteristic function @*(w) 
of F(x) in the general case. Here it is given by formula (5). Applying it to 
the special case 7, —.« (constant) and passing to the Laplace transform, we 
obtain 


fee} 1 


; 1 id (sae aa 
(54) e* F(x) dx = 5 OXP |— =| ——— dr). 


0 0 


Suppose 3i(z)>0, then by the well-known integral representation of 
Euler’s constant C—0,577215... we obtain by a simple modification 


1 o 


(55) c=| 2 


Using it, (54) may be transformed into 


© iS AC is A (9) 
be (a4 7 est : 
| e-% F(x) dx = 2 ae 5 “ exp & a = ad " (Ji(s) > O). 


(56) 


A 


0 ao 
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Hence, introducing the notation ye — 1,781072..., we have 


[ee] 
a 


at 1 ; 
(57) | e-8 F(x) ax ~~ (uy @ gh Pah i (s > * 


0 
Now, from a well-known theorem of Abel type (see [1], p. 503, Theorem 3) 
it follows that for x +0 
xr a 


{1+ 4) any 


(58) F(x) ~ 


Comparing (58) with (49), we get the value of C,, namely 


(59) = ae : ge 3 
: calle E ap\A 
I 1+ Fe | (3 ) 


We note that if we want to deduce (58), then it is sufficient to show 
(57) e. g. for all real s. Actually, the truth of (53) implies that of (47) (see 
[1], p. 473, Theorem 1) and for the determination of the numerical value of 
the constant factor it suffices to investigate the limit only for special values s. 

Thus for the values O= x= we obtain 

, ues 
(60) F(x) = ae 
1 [1 a ar aC ye 


Starting from (60) we can determine F(x) for the intervals (u, 2u), (21, 3u),... 
successively by (52). E. g. for «=x 2u ‘ 


(61) Fx) =— ce Bea : 
rhe une aS 


So it is possible to solve the coincidence problem given in our paper 
[4] for exponentially distributed amplitudes also for constant amplitudes which 
is very important in practice. 

We note that, inverting the Laplace transform (56), F(x) may be obtained 
in the form 


enon 


(62) F)———__—__|xe. $ Jer.) 49 
/ {14 I =| (uyjre t ae a 

where 

(63) iO) Sen ae 


tl frtaoi ta aes 


- 
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and f,(x) denotes the n-fold convolution of (63) which may be obtained by 
the following recurrence formula: 


aw-(n-1) 


(64) f.0= | Peay) iP e en oat 


From (52) we see that F(x) is absolutely continuous. Hence it may be 
differentiated for x >0O, and for F’(x) we have 


(65) xP (x) =~ [F()—Fe—s)]. 


This equation agrees with a recent result of L. PAL [3] obtained in another way. 
For m=O the integral equation may be written in an other form too. 
In the special case G(x) — Ai by (46) we have 


ais ‘ae if ae ee 
iia eagec y, 
_ hence, for F(x) we obtain ie ae equation 


(67) F(x) — | (A+? d F(y) + F(x—w). 
Case 3. If 
\ 0 ue ey 
: {68) G(x) vad 1 eh t) if Neary, 
then by (46) 
uty Sn Pea 
: Mees Sey, 
(69) . Koy) s= Wiles jee 
if ex = ety 


and the distribution function sept may. be obtained by solving the integral 
equation 


(10) F(x) =e | (Ary)  dF(y) + F(xer"—p). 
ta adaeey ot 


On the other hand, from (40) we get 


i Lert xh Ft D) 
271) fa (0) =| F(xe—u)e™d CY Serer ee | mea 


Tt reel 


dt 


or, introducing the constant 


"FU 
(72) Cy = pepe 
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we have 


et 


7 ex: a eee = ( Ft— w) at| 


pial 


(73) F(x) =- 


for the determination of F(x). Hence we see that F(x) is continuous and by 
(73) it is also differentiable for x >0. By (73), for F’(x) we have 


(74) XF' (x)= & [F(x) —F(xe’—1)].. 
From (73) we obtain for the values O=x=yve™ 

] pit yh la 
(75) F(x) — as ee 


Knowing (75), Ete) ie be determined ae for the intervals 
(ue-* + --- + wet ue -+ pe GHer) (f=—1,2,...). Consequently, by 
(73) we can acrerminc F(x) i in the whole interval ©, «wi(e’—1)). It is easy 
to show that F(x) = 1 if x = w/(e*’—1). The constant C,, unknown previously, 
may be determined from the latter requirement. 

If we pass from the equation (74) to the Laplace transform of F(x), 
then, using the theorem of Abel type already mentioned, we can show that 


(76) Goh oe Ye ee 


« pion | (uy Jie 


where 7 = e* = 1,781072...; hence we have 


(77) F(x) coe paper iy Ld 
A 
and 
4A Na WS an fh etl 
a yy é 


in the intervals (0, ne*) and (ue, we + we 24), respectively. For the 
other intervals, F(x) may be also obtained in a form similar to (62). 
For the determination of the constant C,, put 


@ 


(79) D(s) = |e d F(x) (9t(s) = 0). 
Then, by (74) we have 


. ta ee h a-sue” FF ene a | 
(80) s@P'(s) 7 [ew “ D(se-*)— P(s)]. 
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Hence, integrating @’(s)/P(s), we obtain for a real s 


ee PSE 5) 
Bien Os) = exp|— | tree (89) 
oe EX « , 


i) 0 


oO he 
x 

It is easy to prove that the second integral figuring on the right-hand side 
tends to 0 when s—>~. Hence we have an expression similar to. that of ‘Gye: 


‘ Ae 
e 
C ee 2 
(82) D(s) Aw (wyyle sia (s—> 0°). 
Hence, using (75), we can establish the validity of the equation (76) for the 
constant C,. 
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O CTOXACTHYECKUX TIPOUWECCAX, CBASAHHbIX C HEKOTOPbIMM 
PUBNUYECKUMU PETMCTPHPYHOLUMMM TIPMBOPAMH 


JI. Takau (Byjaneuir) 


(Pe3 Me) 


PaccmoTpum cayuainy10 BeAMYHHY 


mh > Sty ta) 


Ot, St 


onpenenennyro Aaa t= 0. Specb 
ass 


‘een xe™’ eco x0 u t=0, 

10 B apyrmx cay4aax, 
a a nomowmuTesbHOe NOcTOmHHOE. IIpeznosonKUM, 4YTO AIH NOCIeAOBATeAbHOCTH Cris lp yeas bitiy See 
pasvoctu ppemen f¢,,,—f,, (20,1, 2,...5 to= 0) ofMHaKoBO. pacnpefeeHHble HesaBMCcuMBIe 
cayyaiinbie BeAMUMHbI C OOMLEH (byHkunei pacnpererenna G(x), a MapaMeTpb! 71, %2,---, Zn, ++ - 
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OMMHAKOBO pacnpepfeAeHHbIe HesaBUCUMbIe CAyYaMHbIe BeANUMHBI C OOULeH (pyHKuMelH pac- 
mpenenenus H (x). 

Boumeonucanneit mpouece (ft) aARaaeTCs MAPKOBCKUM TPOWeCCOM TOJbKO B YaCTHOM 
cayuae, Kora nocaeyoBatTerbHocTh {¢,} nmpescraBaser co6on mpouecc Tlyaccona. O~HaKo um 
B OOWEM CIYYae MOMeHTHI BpemeHn f, MpeACTaBATIOT COOOM MapKOBCKMe TOUKH Mpolecca. 
Iyctb 7(¢,—0) —z7,- 

Toraa nocaesqORaTeAbHOCTh MePeMeHHbIX { 7, } SBIAETCA MAPKOBCKON WeEMbIO. 

Onpejenum CHayana pacnpenenenusi mepemenubix 74(f) uy. Tycth P(t) = x) = Fé, x) 
un PO, =x) —F,,(x). 


B wawem cayyae 4, —0, HO eCan B3xTh 3a 7, NPOMSBOAbHY!O CayyaMHytO BelM4UHY, 
TO UMeeT MeCTO CHe/yroulad Teopema : 


Teopema 1. Ecan E(%,)= <oco u G(O)<1, TO HesaBuCHMO OT Ha4anbHOn 
*PyHkunu pacnpeqesenna CyuyecTByer mpeqembHOe pacnpesenenne lim F, (x)— F(x), sBasro- 


u—> © 


WlantCHd OHOSHAYHO ONPeAeeHHbIM PeUICHHeM HHTerpaNbHOrO YpaBHeHHs 


F(x) = Ka» dF(y), 


0 


RECS GN) | Hee""—y) dG(u). 


0 


B wauem cayyae 7(0) =0; ecau (0) = 7, rae yy NpOMsBOAbHAaA CAyYalinad BenMUHHA, 
TO B BbILIEMPUBeACHHOM BbIPAsKeHUN MIA 7(t) CeayeT yYeCTb HW CyMMAaHA Bua me *. B arom 
cnayuae umeer MeCcTO cnenyroulas TeOpeMa : 


Teopema 2. Ecan E(y,)—«<x, G(x) ne pemeryaroe pacnpefenenne co 
CpeqHem pabHbIM KOHEYHOMY NOMOKUTeIBHOMY YnCay *#, Hu G(O0)< 1, TO HesaBNCcHMO OT 
HavaIbHOU (pyHKyHH pacnpepnenenus F(O,x) cyuyecrByet OAHOSHaYHO OnpenereHHOe pac- 
peewee an F(t, x) — F*(x) npeacrapumas! B Bule 

> © 


F*(x) * | K (xe) [1— G(u)] du, 


rae 


K(x) | F(x—y) dH(y). 
0 
[locne storo ycraHOBUM MaTeMaTHYeCKOR OKUAHHE AAI YNCIAa MpoxOKeHnii u(t) 
“epes WaHHOe sHayeHne a, BO BpeMeHn f, B CrauHOHapHOM Cayuae. 
B kauectse npumepa mpumenum noayyennpie pesyabTaThl kK pelueHniO npodsem, 
CBASAHHDIX C ONCKTPOHHbIM YMHOOKUTEIEM HCO CHeTankoOmM Peurepa—Mionnepa. 


ZUR THEORIE DER GAMMAFUNKTION, DER RIEMANNSCHEN 
ZETAFUNKTION UND VERWANDTER FUNKTIONEN. | 


Von 
MIKLOS MIKOLAS (Budapest) 
(Vorgelegt von A. Rény1) 


Meinem Professor, Leopoin Fryér anldflich seines 75. Geburtstages zugeeignet 


§ 1. Einleitung 


Die Gammafunktion und die Riemannsche Zetafunktion, ferner die mit 
ihnen verkniipften Funktionen zaéhlen wohl zu denjenigen Transzendenten, 
deren ausgedehnte Anwendung von der Zahlentheorie bis zur theoretischen 
Physik eine besondere Wichtigkeit verleiht.' Es ist also kaum zu bewundern, 
dafi} man in der einschlagigen Literatur bis heute nicht nur ganz neue Ergeb- 
nisse, sondern auch solche Aufsatze findet, welche die Theorie der genannten 
Funktionen von einem oder anderen Standpunkt ausgehend wieder ausbauen;, 
oline auf mehr als methodologische Neuheit Anspruch zu erheben. 

Was die Gammafunktion betrifft, so sind in dieser Hinsicht vor allem 
gewisse Arbeiten von ARTIN, GRONWALL, JENSEN, LERCH, PRINGSHEIM zu 
erwahnen. PRINGSHEIM war meines Wissens der erste, der sich bei der Her- 
lJeitung der Haupteigenschaften (im Reellen) konsequent auf didaktische Ge- 
sichtspunkte und zwar auf einen Vergleich der Eulerschen und Gaufischen 
Erklarung von /'(z) stiitzte: ,,.Wa&agt man ... die Vorziige jener beiden Defi- 
nitionen gegen einander ab, so diirfte ... es sich am meisten empfehlen, 
zwar von der Integraldefinition auszugehen, sodann aber vor allem die Pro- 
duktentwicklung daraus abzuleiten und nunmehr die tibrige Theorie auf den 
gewonnenen Produktausdruck zu griinden.“* Von ihm stammt eine unmittel- 
bare und strenge Methode fiir die Verwandlung der beiden genannten Aus- 
driicke ineinander, welche aber durchaus nicht einfach anzusehen ist. JENSEN® 
gab eine ziemlich elementare, auf Funktionalgleichungen und Reihen- bzw. 
Produktdarstellungen einschrankte Behandlung des Stoffes; diesen schdnen 
Aufsatz entwickelte GRONWALL' fort, indem er, nach Vollstandigkeit bestrebt, 
auch die Beziehungen der Gammafunktion zur Integralrechnung (ohne kom- 
plexe Kurvenintegrale zu betrachten) systematisch verarbeitete. LERCH beschaf- 


1 Wir wollen gleich z. B. auf die wohlbekannten zusammenfassenden Arbeiten bzw. 
ausgezeichneten Monographien [42], [26], [8], [39] hinweisen. Fiir Literaturangaben und 
geschichtliche Bemerkungen s. auch [30]. 

2 Vel. [34], S. 457. 

3 [12]. 

<a Us 
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tigte sich in zahlreichen, meistens béhmisch publizierten Arbeiten mit ver- 
schiedenen Teilen der Theorie und fiigte interessante neue Ergebnisse hinzu. 
Man verdankt ihm auch solche Aufsatze, in denen die Theorie der Gamma~ 
funktion von Anfang an mit originellen Methoden entwickelt wurde. Beson- 
ders sind gewisse Lerchsche Entdeckungen tiber den Zusammenhang der aus. 


oe. . ee 
»'——., durch analytische Fortsetzung entspringende Funktion S(s, z) (die 


7: = 


= Ca A). 
man heute als Hurwitzsche Zetafunktion zu bezeichnen pflegt) und von /°(z), 


die daher flieBende Formel: /’(z)— exp 5 Gs )—Z9)| , ferner die fun- 


= 


damentalen Leistungen von LERCH betreffs der unvollstandigen Gammafunk- 
tion hervorzuheben.” Etwa vor zwanzig Jahren ist eine Abhandlung von 
ARTIN® erschienen, welche vom bekannten H. Bohr—Mollerupschen Satze, 
d.h. von der logarithmischer Konvexitét der Gammafunktion ausgeht; daher 
werden die Grundeigenschaften der positiven Funktion y—/'(x) (x >0) ab- 
geleitet. — Eng schlieBen sich mehrere umfangreiche Arbeiten’ von ALEXE- 
JEWSKY, BARNES, BENDERSKY, MELLIN heran, welche die Verallgemeinerung 
von /’(z) zum Gegenstand haben; sie greifen teilweise tief in die Funktio- 
nentheorie hinein (MELLIN), die zum Grund gelegten Definitionen erscheinen 
aber nicht immer so einfach bzw. natiirlich, daf man bedeutsame Anwen- 
dungen hoffen kénnte.’ 

Das Ziel der vorliegenden Abhandlung ist nun meine gewissen unlangst 
publizierten> und seitdem wesentlich erweiterten-neuen Resultate iiber die 
Gammafunktion und verwandte Funktionen in einen méglichst iibersichtlichen, 
konzisen Durchschnitt der ganzen Theorie hineinzubauen. Es sollen zum 
Hintergrund folgende Bemerkungen dienen: I. Sucht man eine einfache Ver- 
allgemeinerung /'(z) von n! ins Komplexe mit /(z+-1)—z/7(z) (*), so ist 
es naheliegend, das Produkt z(z-+-1)---(z+-n—1) bzw. seine (etwas hand- 


ad , 1 1 ] : 
lichere) logarithmische Ableitung .;(z, n) —-+—_-++ ... + —____. mi 
z z+1 Z+n—l 
; ] 1 ‘ 
P-1(2 +1, 2)—P1 (2, 2) =— Ty a: (**) zu betrachten ; um daher eine Lésung 


von (*) zu erhalten, bediirfen wir offenbar des Grenziibergangs n—~; da 
aber ftir feste z 3 4(z,n)~logn besteht, so gelangt man natiirlicherweise zum 


» Vel. z. B. [17]—[25], ferner [53]. Wichtige Angaben iiber mehrere schéne Resul- 


tate von Lercn findet man in [10]. — Professor Bortvka (Brno) war so freundlich, meine 
Aufmerksamkeit auf diese Abhandlungen zu lenken. 
(6 [2]. 
* Vegi. [1], [3], [4], [5], [27]. — Einige Erweiterungen sind iibrigens nur scheinbar, 


indem man sie durch passende Transformationen auf /°(z) zuriickfiihren kann; ahnilich ist 
der Sachverhalt mit den friiher untersuchten sog. ,analytischen Fakultiten. (WEIERSTRASS.} 
8 [29]. 
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Ausdruck “(z) — lim [log n— ,(z,n)]_ mit P(z+1)—P(z) a: und durch 


11> © & 


7 '(1)—1 zum Ansatz 


r ~{ B_y(h at 


£42) = OX) | G(t)dt— lim |ne ' = lim — is dysnle 
| ) w+ 0 nro 2(2+ 1)-+-(z+n) 
(z= 0, —1,...), 
dh. zur Gaufischen Erkldérung der Gammafunktion. — II. Setzt man allge- 
mein #,(z,n)= 2" + (z+ 1)"+---+(z+n—1)" (p ganz), so lassen sich die 


Ableitungen von “4(z) folgendermafen ausdriicken : “4 ''(z) = (—1)"(r—1)!- 


Seg ; ee 
pum £_»(2, n) == (—1) (y—1)! (2-4 4)" (7 = 2,.3,...)..— Il. Die(fir jedes 


ganze k = 0 bestehenden) Identitaten: fo smit- (Zz) = O° und 


l pee 
zk 
1 
1 (—l)'a [. ae Fs wee 
7-3 > aera cos(z-+k)audu mit z==0, +1, +2,... erméglichen durch 


0 


Summierung offenbar zweierlei Integraldarstellungen fiir “(z) und verwandte 
Funktionen, namlich solche, die in der rechten Halbebene %i(z)>0 bzw. 
solche, die fiir jedes nicht-ganze z gelten.’ 

Hiermit ist der folgende Aufbau motiviert: wir untersuchen im § 2 die 


n-1 


Potenzsummen (rationalen Funktionen) (,(z, 7) — »'(z+-k)” mit beliebigen 
k=0 


ganzen Exponenten p, im § 3 die Funktion #(z) und ihre Ableitungen, welche 
fiir n—> o~, endlich im § 4 /'(z) bzw. log /°(z), welche durch Integration ent- 
springen; jeder Abschnitt beginnt mit den entsprechenden Differenzenglei- 
chungen und den daher flieSenden anderen Funktionalgleichungen, auf welche 
die verschiedenen Reihenentwicklungen, Integraldarstellungen, die einfachsten 
Charakterisierungen, gleichwie asymptotische Entwicklungen folgen. Die sehr 
leicht sich ergebende Erzeugungsfunktion 


1d ge el IS Be, ny 
( Ma ) e | a , p! 


Jegt im § 1 ganz nahe, die Bernoullischen Polynome als Hilfstunktionen durch 


(1. 2) = B,(2) + Bw ++ + By (Zz) we (|w| < 2s) 


® Alle klassischen Integraldarstellungen der Theorie, bis auf ein, das sog. Hankelsche 
Integral, sind bekanntlich nur in einer Halbebene giiltig, — Wir bezeichnen mit uw stets 


eine reelle Variable. 
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einzuftihren; dann ist ¢,(z, n) = p![Bpu(z+2)—Bpui(2)] (p = 9, 1, 2,...) und 
man erhalt nebenbei bequem alle wesentlichen Beziehungen tiber B,(z) und’ 
die Bernoullischen Zahlen B,—4A!B,(O), ferner die Euler—Maclaurinsche: 
Summenformel, welche in den folgenden (insbesondere in asymptotischen 
Formeln und Integraldarstellungen) oft benutzt werden. 

Betreffs der Vorteile der skizzierten, auf Summendefinitionen und zwei 
Identitaten gegriindeten Behandlungsmethode seien die folgenden erwahnt: 
1. dieser Weg erlaubt die auftretenden Reihen- und Produktentwicklungen 
mit Restgliedern zu versehen;" die erhaltenen verscharften Beziehungen ent- 
halten speziell — im Fall der Teilbruchzerlegungen — auch die klassischen 
Integralformeln (n==0), so daf es sich zugleich um die Verallgemeinerung 
derselben handelt; 2. die asymptotischen Entwicklungen (insbesondere die 
Stirlingsche Formel) entnimmt man durch geringe Rechnung den entsprechen- 
den fiir @,(z, 7), welche aber nach Euler—Maclaurin sofort aufgeschrieben 
werden kénnen; 3. man gewinnt auch solche eigentlichen, aut (0, 1) erstreck- 
ten neuen Integraldarstellungen, deren Integrand trigonometrische Funktionen 
enthalt und welche — gegen die bisher bekannten — in der ganzen z-Ebene 
gelten; 4. die letzten gehen durch einfache Transformationen in komplexe 
Kreis- bzw. Schleifenintegrale iiber, wobei sich die Verwendung einer bekann- 
ten Riemannschen Idee” als entbehrlich erweist; 5. es leuchtet durchwegs 
unschwer ein, welcher Wert des (unendlichvieldeutigen) komplexen Logarith- 
mus, bzw. welcher Zweig von Log/*(z) zu verstehen ist;'° 6. als Nebenpro- 
dukie ergeben sich leicht die (mit Restgliedern versehene) Teilbruch- bzw. 
Produktzerlegung des Kotangens und Sinus, die “on EULER bzw. SONIN her- 


riihrenden geschlossenen Ausdriicke fiir ¢(7”) — She ra (vy = 2, 3,...), in welchem 
Saal 1 


Bernoullische Zahlen und Polynome vorkommen, eine neuartige Integraldar- 
stellung fiir die Eulersche Konstante y, eine neue, sehr einfache Herleitung 
der sog. Lerchschen trigonometrischen Entwicklung und somit der Kummer~ 
schen Reihe usw. 


0 Dies scheint in der Literatur tiberhaupt und im Fall eines komplexen Veriinder- 
lichen noch nicht geschehen zu sein. 

" Man denkt des Ansatzes: ist der untere oder obere Grenze eines (uneigentiichen) 
Integrals eine singulare Stelle des Integranden, so mag es niitzlich sein, einen die singula- 
ren Punkte umgehenden neuen Integrationsweg zu betrachten. — Die von Riemann in 1859 
fiir ¢(s) benutzte Methode diente wohl Hanxer als Muster in seiner Habilitationsschrift iiber 
F(z) (1863). Vgl. z. B. [7], S. 159. 

' Mehrere einschlagige Arbeiten fixieren die Bedeutung des log-Zeichens nicht ;. 
andere betrachten iiberall den Hauptwert, was aber, wie z. B. auf Grund der Ginzelschen 
Untersuchungen [9] miihelos nachweisen kann, nicht stichhaltig ist. — Wir weisen gleich 
auf einen interessanten Aufsatz von O Borivxa ({6]) hin, welcher auf einen diesbeziiglichen 
Fehler im Lehrbuch: Serret—Scuerrers, Diff. u. Integralrechnung, 6-7. Auflage (1921), 
Bd. I, S. 220, aufmerksam macht. 
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dLogI'(z) F(z) 


Man findet z. B. die Beziehungen fiir P(z) ep eae TO (vel. 
3, VI ff.): 
n-1 
ie 

(1.3) we+y—S( 4, =, sot Otel) (= 0.1, eye 
mit 

| fe —— ada {ir (Zz) = 0, 
1. 4) Q,,(2)- oe : 
RN Vises 1) Sinz, sec ee (cos tzu — COS 712) cos (2 + 

| + (u sin wz—sin zu) sin (2n + I) cut du— faa 


fiir jedes nicht-ganze z. 
Daher entspringen folgende Ausdriicke fiir die Hurwitzsche Zetafunktion 


BLAS, 2) = ys - mit s=+7-+1 (y positiv-ganz): 
o(s, 2) = 2 (e4a) pu vap ganz) 


z ; ] ; 1 S}i 
ie | rae du (i(z) > —1), 


Be fea; 2H1)= 


eas % [aed F 
oy! dz” elas = 5 etg v2} — 
1 
PS v1 . + 
Ee mu 0 sin mzu } 
Be A A e 2320, 42 loves) 
| 4 tg 2 mil sin Zz |u| h2 ae igs ly) 


(1. 3) liefert mit m=O die Legendresche Formel: 


(1.6) DE f= | eae (2(z) > 0) 


bzw. die neuartige Darstellung : 


nM feat : 
e127) B(z) + (7 + 2 log 2) + > Co te >| Sec “5 


tf 


sin 0Z 

(eae OR es); 

fiir n— oo aber die Teilbruchzerlegung von “/(z): 
= ‘ 1 


>" Gem “sty (Pas 02) 2). 


(1.8) Be) +y— 


13 Die rechtsstehende Summe ist fiir 7—-O mit Null zu ersetzen. 
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Mittels Integration gsi man aus (1.6) und (1. 7) 


Ih a : | au, 
78 log u 


(1.9) 3 a 
1 v 

“late be al = sal dx| du, 

|; i SING 
wihrend aus (1.5) insbesondere fiir z—+O die Ausdriicke 
aw) o(y + et Yfiog ; pane. 
ted) : i Ht) 1a 
bzw. 


(ers ‘aoe cj" (vy =2u-+ 1), 


(in) al z 
(—1)" (2299 | Boys(u)ctgaudu (v¥=2.p) 
folgen. | 0 
Die rechte Seite von (1.7) laBt sich leicht in ein komplexes Kurven- 
integral umformen; man erhalt 
; el Peas fa 
D 2s Mat BRS a a a 
(1.12) B(2)+ Gy +2log 2) +4 etger2 = iP iaalt =e 
(Za-U; tel; rs 
wo f= e'ls« (mit dem Hauptwert des Logarithmus) und der in positivem Sinn 
durchlaufene Einheitskreis ¢—-e'"" (—l1=u~1) als Integrationsweg zu wah- 
len ist. 


Ein anderes Beispiel bietet die in 


0 


§ 4, IX ff. gewonnene Darstellung : 


(1) 1 
(1. 13) I'(z)= g(z)4 pate: rpg tan) (n=0, 1, 2,...), 


wobei (2) eine ganze Funktion, namlich | we-te “du bedeutet, wahrend 
i 
(— bes | n +H tor . 
4 {fa-s PO Or aT a (Ji(z) > 0), 
(1.14) gn(2) acre 
at " or COST CO (or 
Tce | | (1—x) € cos (sru(z+-n+1)+ 
00 


+xsinstu)dxdu (255 0,9: 1} Shee 


' Durch die Substitution ¢— e-’ erhalt man daher die Riemannsche Integraldar- 
stellung von ¢(7). 
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Setzt man hierin 20, so ergibt sich 


(o0) 1 (o0) 
(1.15) I(2) = | u**e“du-+ |u*e-"du= | u-e-"du C2) =O), 
1 i) 6 


d. h. das Eulersche Integral zweiter Gattung fiir die Gammafunktion bzw. 
die neue Integralformel : 


(ee) 1 


(1.16) ree edu + 


| eS" cos (euz + sin scu)du 
. hatte Orig) secioes a) 
laht man dagegen. noe streben, so entsteht 
] 
L 17 r(@)= 
(1.17) @=0+ 25 nee 


die sog. Prymsche Teilbruchzerlegung von ae welche die Residuen an 


sin 70z 


(z== 0, —1, —2,...), 


: aN 
den einfachen Polen z—0O, —1, —2,... [ namlich res 1’'(z) =| in Evi- 
\ Z=—A wo 


denz setzt. 
Aus (1.16) gelangt man durch die Transformation ¢=e'*" gleich zu 


mieis) J°(2) ae a | Gan) edt Or ears fer .car} 


wo die Integration im mittleren Glied auf den (von —1 bis —1 in positi- 
vem Sinn durchlaufenen) Einheitskreis, im ersten und dritten aber auf die 
negativ-reelle Achse zu erstrecken, ferner t* * =e ?!8', (#71), — e& Dicgiti 
(mit den Hauptlogarithmen) zu verstehen ist; Ge geradlinigen a bezie- 
hen sich also auf das obere bzw. untere Ufer des Schnittes lings t=O auf 


der Riemannschen log-Flache. 
Die Anwendung des Cauchyschen Hauptsatzes fiihrt nun miihelos zur 


ay A ii A ) 
Jrté at ( fete at ee ake 1 of 1 | 


1 (5-5) 
2i sin 762 

(2A ra yee: 
' wo his die nach wachsenden bzw. abnehmenden w zu durchlaufenden Halb- 
geraden t = ue+*" (R=u =~), fx aber den Kreisbogen t= Re'** (—d = 9 SO) 
bedeutet; ja sogar, man gewinnt 


(1.19) r2= 


“ 


beers 


2-1 ¢ : \ | 
Crt t-€.dt (CAL Wipes cot ie Aine 


(1, 20) 12) 


15 Sie entspricht, wie man sieht, genau dem wohlbekannten Mittag-Lefflerschen 
Teilbruchsatz iiber meromorphe Funktionen. 


11 Acta Mathematica VI/3—4 
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mit einem beliebigen Integrationsweg ©, welcher von ~ ausgehend bis zu 
einem Punkt m >O in der unteren, dann nach ~ zuriick in der oberen 
Halbebene verlduft und zwar so, dafi er ganzlich in einem Bereich |f| =e, 


larg ¢| 26a (0, 0 fest) liegt. — (1.20) ist als eine Erweiterung des 


Hankelschen Schleifenintegrals fiir [(z) (wobei eine wesentlich speziellere 
,ochleife* in Betracht kommt) anzusehen. 
Von den iibrigen neuen Darstellungen sei noch die fiir O< z< 1 giiltige 


1 
1 if oP) 
Fo RT ba eM A _ (4-7u(sinzexu — sin2axzu | a 
GE BO x (wi eo) ee a2 | | Bo: sites sin 2 xz | axdi| 


) 


hervorgehoben. (Vgl. § 4, VII.) 

Uber die naturgemai sich aufwerfende Frage, unter welchen Zusatz- 
bedingungen die (bei der Definition benutzten) Differenzengleichungen” von 
I'(z), P(2), (2), ... diese Funktionen allein zur Lésung haben, ergeben sich 
bekanntlich leicht gewisse Limesrelationen mit 3i(z)— ~.(Vgl. §§ 3, 4, VI. 1.) 
Wir zeigen nun im Fall von #(z) und ihrer Ableitungen auf Grund des 
Liouvilleschen und Mittag-Lefflerschen Satzes, dafii jene Bedingungen durch 
Regularitats- und Beschranktheitsforderungen inbezug auf den  Streifen 
1=M(z)<2 ersetzt werden k6nnen (vgl. § 3, VI. 2); /(z) laBt sich laut 
eines kaum bekannten Scheeffer—Wielandtschen Satzes (vgl. § 4, VI. 2) ahn- 
licherweise charakterisieren. Die letzten Satze sind fiir die Identifizierung 
irgendeiner vermuteten Integraldarstellung mit der Summen- bzw. Produkt- 
definition einer betrachteten Funktion offenbar handlicher, als die vorher 
erwahnten.” 

Endlich sei bemerkt, dafi ich — in Anbetracht des Charakters dieser 
Abhandlung — an allen Stellen, wo es mir méglich ist, Autoren und Litera- 
turangaben zitieren werde, obgleich es sich teilweise um klassisch gewordene 
Resultate handelt. 

Ich hoffe in der zweiten Mitteilung auf eine verallgemeinerte Theorie 
der Riemannschen und Hurwitzschen Zetafunktion zuriickzukommen. 


Es leuchtet ein, dai die Lésung einer Differenzengleichung der Form F(z +- 1)— 
— F(z) = (2) nur bis auf eine additive, mit 1 periodische Funktion, die von F(z+ 1) 
p(z) F(z) aber bis auf einen (beliebigen) mit 1 periodischen Faktor bestimmt ist. 
 Vgl. Knopp [16], S. 47. — Auf solche Art gelangt man am kiirzesten zum Integral- 
ausdruck von g(z) in (1.17) (§ 4, X). 


DIE GAMMAFUNKTION, DIE RIEMANNSCHE ZETAFUNKTION UND VERWANDTE FUNKTIONEN, I 389 


§ 2. Eigenschaften der Funktionen 3, (z, n) 


Als eine einfache Verallgemeinerung der Potenzsummen_ sukzessiver 
natiirlicher Zahlen, betrachten wir die summatorische Funktion 


a 5(2, 2) = 2" +241)? +--+ (@+a—1)?, 


wobei z eine komplexe Variable, wahrend der Parameter p eine ganze Zahl 
bezeichnet. 


Speziell ist also 3(z,n)=n (z=+0); @,(z,n) ist eine ganze rationale 


Funktion von z fiir jedes fixe p>0O, dagegen erhdlt man bei p——yr 
fae ToD...) 
eae) Bolen) = a+ i Paine a Es eed: 

re VEN Geni 


d. h. eine gebrochene ee Funktion von z. Wie man sieht, liefert (2. 2) 
zugleich die Partialbruchzerlegung von @_,(z,n); sie setzt in Evidenz, dab 
die Punkte z—0O,—1,...,—(n—1) samtliche Pole (7-ter Ordnung) von 
8_,(z, n) sind. 

Es seien gleich die Werte 


2: 3) Bp (1, n) = 1° 4+-2°+---+ n?, 
Oe ares a gs 3 
| (2. 4): 6, | 5 .n|= at 1 37-4... et el ep ite art; t); 
ferner 
E(2. 5) 6, (0, n) == 1° +2”+.---+(n—1)’ (p > 0) 
erwahnt. 
Wir gehen zur systematischen Untersuchung der Funktionen 4, (z, “3 
iiber. — Zundchst setzt man die folgenden, fiir jedes p geltenden Grundeigen- 


schaften von (,(z, n) fest: 
I. Differenzengleichungen : 
- (2.6) Bp (z,n + 1)—B, (z, n) = (z+n)’, 
(2. 7) 6, (z+ 1, n)—2) (Zz, n) = (z+-n)"— 2”. 
II. Additionstheorem : 
((2.8) 6p»(z,m-+n) = 6) (z+n, m)+ 8 (z, 2) = & (z+, n)+ 6, B 


(isai, 25%).); 
lll. Erganzungssatze : 
(2. 9) 6, (1—z, n) = (—1)"8,(z—A, n), 
(2. 10) Bp(Z, nN) + (— 1)" 6, (1 —zZ, 2) = 6) (2—n, 21). 


18 Da und in den folgenden Zeilen kommen alle Werte von z in Betracht, fiir welche 
die hierauftretenden Funktionen erklart sind. Die Benennungen entsprechen meistens den- 
jenigen der Differenzenrechnung. 


11* 
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Fast ebenso unschwer erkennt man, daf die Summe der Funktionswerte 
an gewissen m Aquidistanten Stellen der z-Ebene durch einen Funktionswert 
mit m-fachen Argumenten ausdriickbar ist, genauer 


IV. Multiplikationstheorem : 


m-1 


(Zeu1) 2,8 tees n)— he 6,(mz, mn) (n= 1,2, eee 
= m! 


BEwEIs. Es ist 


m-1 m-1 n-1 


Dias n|= one 


O k=0 


n- 1 n-1 ~ 


-1 
“ ) > (me i km)" + > [mz+(km+1)}" + 2 [mz+ (km +m =e 


mn-1 


me (mz +1)’ —,(mz, mn). 


me 


Die gliedweise Differentiation bzw. Integration von ,(z,n) (p,1n fest) 
zeigt, da} diese Operationen — abgesehen vom wichtigen Spezialfall p——1 
— im wesentlichen nicht dem Kreis unserer Funktionen hinausfiihren. 


V. Ableitungen und Stammfunktionen. Fiir jedes p ist 


d’ , 
(2. 12) dz 8,(2, n) = p(p— 1) sae (p—A i 1) 8)-a(Z, n), 
insbesondere fiir p= —1 
(2. 13) jee. 1(2, n) = (—1) 4! Bain (z, n). 


i. 
Es gilt ferner fiir p==—1 


(2. 14) | 8, (z, n)dz = —— ot 1 - Pyii(z, 2)-+ const. 
und” 
(2215) \8 \(Z, n)dz = log z+ log(z+1)+ +--+ log(z-+- n—1)-++ const. 


in jedem Bereich der z-Ebene, welcher keinen Punkt der negativ-reellen Achse 
(einschl. 0) enthdlt. 


Auf Grund von (2.14) und (2. 15) ist ein pe langs eines geeig- 
neten Weges genommenes Kurvenintegral von ,(z,n) sofort berechenbar. 


oh Da und durchwegs bezeichnet ,log“ den Hauptwert des komplexen_natiirlichen 
Logarithmus und ,arg“ dasjenige Argument, welches zwischen —z (ausschl.) und +2 
(einschl.) gelegen ist. 
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Besonders einfach sind die folgenden /ntegralrelationen : 


+1 
3 : 
(2 16) | By(t, n)dt —— pel [B,.1(2+ il. n)— 8,,(z, n)| ed 
on ere rs pl), 
z+] 
ee | Fa == log(z + n)— log z, 


wobei |jargz|<- und der Integrationsweg ganz im Inneren der langs t=0 
aufgeschlitzten Ebene verlaufen soll. (Wir wollen sie als Spannenintegrale 
bezeichnen.) Man braucht noch?’ 


1 | Teel | 
, 2n)! 2 \\ 
(2. 18) |e, n)du — log ee nr aT . | ) 


te] ee 


VI. Generatorfunktionen. Es gelten die pcrpomas 


a ee —— one 
(2. 19) & <a = > ile pee i ; 
(2. 20) b4(z—w, n) = Pat: (Zz, nw; 
zy | 
und zwar die erste fiir jedes z und w,” die zweite fiir z+-0, —1,..., —n-+1 
und |w|< min |z+k|. — Somit mégen die linksstehenden Ausdriicke als 
WSO AS tee 


Generatorfunktionen der Funktionenfolgen (3,(z,n) (p=-0,1,2,...) bzw. 
6_,(z,n) (v=1,2,...) angesehen werden. 


BEwEIs. Man hat ieee fiir beliebige x und z 


n-1 


> We Slide Dy 
DAC nm) Sao SS Sy (z a Nerve — bs everh) — e*"' te 
p= k=0 — 


Wendet man ce ee auf peas n) den Cauchy—Taylorschen 
Entwicklungssatz an (vgl. (2.12)), so ergibt sich gerade (2.20) samt dem 
genannten Konvergenzradius. 

Die Relation (vgl. (2. 13)) 


(ENS es he (z, n) bs 
(2. 21) Ge nl) == ey) pe (v2, 3,...) 


@ 
20 4 sei stets zur Bezeichnung einer reellen Variablen aufgehalten; x soll vielmehr 
auch in diesem Sinn zu verstehen, wenn nicht eine andere Festsetzung getroffen wird. 
21 Unter dem zu w-==0 gehorigen Funktionswert der regularen linken Seite von 
(2. 19) ist natiirlich der entsprechende (offenbar existierende) Grenzwert n zu verstehen 
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und (2. 20) zeigen die ausgezeichnete Rolle, die > i(z,n) unter allen Funk- 
tionen ~.,(z,) spielt: @2(z,n), &3(z,n),.-. lassen sich einfach mittels 
@1(z, n) erzeugen. 

Was (2. 19) betrifft, so liegt es nahe, die Potenzreihenentwicklung 


wer 


(2. 22) Foes 


= By(z) + B,(z)w+ ++: + Bi (Z)w + --- 


als Hilfsmittel heranzuziehen. Sie gilt offenbar fiir beliebige z und jw) < 2:7; 
schreibt man (2.22) in der Form: 
S7 (zw)? -( i lS I Lu lay} — Dae 
2 p! —= _ B, (z)w S (w+ + 1)! Ww | (|W = 22); 
so folgt (nach dem Identitatssatz fiir Potenzreihen) die Gleichheit der ent- 
arog Koeffizienten, d. h. identisch 


1 zp 
at + 47 Fn =a! (p=0, 12a 


Auf Grund dieser Li Bia Ss sind B,(z), B,(z),... sukzessiv leicht 
zu berechnen: man erhalt 


(2223) B, (2) 7s - By(z)+ 


By(2)— 1, B(2)=2—, mee 
(2:24) * Bz) == ane |e 2-3) Ba) = 3,242 He a 


B,(z) = ww? 2(z gate bie (eee usw. 


Man sieht zunachst, dai allgemein B,(z) sich als ein Polynom (p-ten Gra- 
des) mit rationalen Koeffizienten erweist; B,(z), B,(z),... heifen bekanntlich 
Bernoullische Polynome und treten sehr oft in der Analysis auf. 

Die Werte 


(2. 25) Bi = 4! Bi), - @=0)1, 2-5) 


nennt man tiblich Bernoullische Zahlen; sie sind also rational und geniigen: 
der Formel (vgl. (2. 23) fiir z—0) 


(2. 26) Po e+ (PT Ja+--+[P F180 (20, | oe 


woher man ohne Miihe z. B.~ 


* Da die linke Seite der Entwigklung [vgl. (2.22) fiir z— 0]: <j + aa 
e—] 2 
2 ey B, 3 : . 
1 7 Ww 31 ws-— +--+ eine gerade Funktion von w ist, so mu die rechte Seite nur 


gerade Potenzen von w enthalten, d. h. jedes By mit einem ungeraden 2 ~ 1 verschwinden. 
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(2. 27) fee B, oe : pe ) B, oti Bp 


bs 


Da 6 
1 
Bi= A500 B,= B; = B;=---=0 


findet. 


Die Ahnlichkeit der Erzeugungsfunktionen in (2.19) und (2. 22) zeigt, 
dafi die Eigenschaften der Bernoullischen Polynome analog denjenigen von 
#,(zZ,n) sein sollen. In der Tat, durch die Methode der Koeffizientenver- 
gleichung ergeben sich aus (2.22) leicht die (fiir jedes z geltenden) Re- 
lationen : 


(2. 28) Ben 4-1) = Bo) ei ac 

(2. 29 B,(1—z) =(—1)"B,(2), 
ies ®) . hs | Gaeead ty Pho. 8 fb 
- (2. 30) pa B, E = |= eel B,(mz), | 

t2 a1) Boi (Z) = Bp (Zz) 


Die wiederholte Anwendung von (2.31) und der Taylorsche Satz liefern 
(70, 1, 2,..-) 


1 1 F 1 
B, (z+ h) = B,(h)+ qr Bra M24 ay Brae + a cape Make 
speziell fiir h—-O bekommt man (vgl. (2. 25)) 
I Dp Dp : 4 | 
acd FSP “Y ae : 
fac) £B,(2)=— pl Fi +(2 ) By. z+(F |B,» an a a By-27\, 


also die explizite Form von &,(z) mit den Bernoullischen Zahlen in den 
Koeffizienten. ) 
(2.31) und (2. 28) ergeben sofort das Spannenintegral : 
: Z+1 
: - 
(2. 33) | BQdt=2-  (p=1,2,...), 
wobei der Integrationsweg zwischen z und z+1 beliebig gewahlt werden 
kann; man hat den Spezialfall 
1 


(2. 34) | B,(Qdt— 0 pani 


fiir sich zu erwahnen.~’ 


23 Die Bernoullischen Polynome sind offenbar durch Bo(z)=1, (2.31) und (2. 34) 
vollstandig determiniert, konnen also durch diese Bedingungen definiert werden. — Es zeigt 
sich auch leicht, dab B,.,(z), von additiven Konstanten abgesehen, die einzige Polynom- 


lésung von (2. 28) ist. 
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Es sei noch bemerkt, dafB man von der wohlbekannten trigonometrischen 
Entwicklung 


1 ~ sin 2A7x re 
(2.35) Bi.(x)=x— yn ee (OSx= 1) 


ausgehend, durch wiederholte Integrationen und unter Beachtung von (2. 31) 
allgemein (u=1, 2,...) 
: y 2 cos 2Amx 
) —— — u 1 od 
B ap. (x) ( I ) — (2 i zt)" ? | 


2. 36 OS iti20 
( at wo. 2Sin 2Ax \ ( ) 
Bout) =(—1I)" agape 


findet. 

Bezeichnet man nun die (mit 1 periodischen) rechtsstehenden Reihen- 
summen in (2. 35), (2.36) mit B,(x) bzw. Bou (x), Bou+1(x),* so hat man die 
leicht nachweisbare Identitat 


n ve 
n-1 


> 1H) =| ferax—F 1) 11+ | COs ax 


und die daraus mittels Teilintegration fliefende Euler—Maclaurinsche Summen- 
formel : 


SK) —| foax  & >F [f° (n)— fe’ (0) ] ae 
Zi 37) \ 0 Sp 
+ (—1)" ‘| By(x) f(x)dx (N= 1,275: 


sie gilt fiir eine beliebige Funktion f(x), deren hierauftretende Ableitungen 
in [0,] vorhanden und stetig sind.” 

Von den soeben angegebenen (bekannten) Tatsachen beziiglich der 
Bernoullischen Zahlen und Polynome werden wir in den folgenden oft 
Gebrauch machen; sie sind uns niitzlich vor allem bei der Untersuchung der 
natiirlichen Frage, wie jede summatorische Funktion $,(z,n) sich in einer 
geschlossenen Form (d.h. als ein Ausdruck mit einer von 2 unabhangigen 
Gliederanzahl bzw. als ein Integral) aufschreiben laht. Was (2.37) betrifft, 
so ist dies eine Quelle asymptotischer Beziehungen. 


24 Also By+1(X) =B,+1(x) fiir jedes p in 0< x <1. 

> Fiir Anwendungen und Verallgemeinerungen vgl. z. B. Wirtincer [41], Knorr [15], 
Noértunp [31] bzw. MrkorAs [28], Koscuuakorr [13], [14]. — Letztere Arbeiten enthalten 
auch erweiterte Beziehungen iiber die Gammafunktion. 
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VII. Geschlossene Darstellungen. Es ist 
~ (2. 38) 8, (z, n) = p! [Bpis(Z + 2)—Byii(2)] (p= UIee. 
fiir jedes z und 


1 obo wees. 

2. 39 eee elon | ‘- A : ee 
( ) (z,2)= em ye u (log : ea ONE AG ee 
yur R(z)>0. — Ferner 

uf 
| (2. 40) Bs(2.2) = belbbiots y | se hal qr fie, uyou (y= 1,25...) 
BGEe es) er gee ioe 
mit 
1 “ tee 
2.41 H, and mtd ame Sit, 
( ) (2,0) = = cos (2 x) ea +( 1) cos {2 n ae 


fiir jedes nicht-ganze z und (u —1,2,...) 


u Qu- 2n + 1): ctu 
ey | cos ( | 
2 (22) Bai) tg os du, 
(2. 42) 8_,(1,n)= =a ; falls y= 2u—l,. 
Vie Ou ; sin (2n-+ 1) ztu 
| ee (220)"| Be i a <2 LE 


wenn v= 2." 
Bewels. 1° Setzt man z+ statt x in (2.28) und summiert fiir 
k—0,1,...,n—1, so entsteht (vgl. (2.1)) unmittelbar (2. 38). 
2° Man betrachte die Identitaten (k = 0, ganz) 


I 


; 1 = i z+h-1 ye 
(2. 43) ER | wk du (2(z) > 0) 
0 
und 
1 
Dias EteeL ye: Za le ; oa atntehy 
(2. 44) ae sIe | cos (z-+-k) stu du (2=0; 1, Say 
0 


26 Unter uz (a > 0) ist stets e!o#" mit dem reellen Wert des Logarithmus zu 


-verstehen. 
27 (2.42) mag auch als ein Spezialfall von Q. 40) aufgefaBt werden, indem die rechte 


Seite von (2.40) (wie die Potenzreihenentwicklung von H,,(2, uw) mittels (2.22) zeigt) fiir 
z—>1 eben in diejenige von (2. 42) tibergeht. 
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Da man laut bekannter Satze der Funktionentheorie* die wiederholten 
Differentiationen nach z in (2.43) und (2.44) unter dem Integralzeichen 
ausfiihren darf, gelangt man auf Grund von (2.21) durch Ableitung und 
Summation gerade zu den Formeln (2. 39) bzw. (2. 40). 

3° (2.42) flieBt am bequemsten aus 


1 


2 


= (1) (2s | Bo, (u) cos 247tu du, 


0 


(2. 45) o 


1 
Dy 


(2. 46) ue (Sl) 20m. | Bs, -(u) sin 2A-du 


| (A= lee) 
0 
(vgl. (2. 35), (2. 36)) unter Benutzung iiblicher trigonometrischer Summations- 
formeln. 


-Es sei gleich hervorgehoben, dafi man aus (2.40) mit »—1 leicht ein 
bemerkenswertes, tiber den Einheitskreis erstrecktes Kurvenintegral fiir °-\(z, n) 
gewinnen kann. 

Wegen der Eulerschen Beziehungen findet man namlich 


: q & iba 
cos [2-4] au +(—1)" cos(z + n—s] vu 


cag cee 
2 


ee 1 -+ (=1)— ec é pen 1 a (1) eum 
af és 1 a}. en 1 if pninw : 
also durch die Substitution ¢—e'*" die Darstellung 


1 


3 =e Be imeu 1 EA Ob we a 
p 1(2, Nn): Qsin tz | e Tew du— 
(2. 47) | 
1G pene a a 
TELE eee ae 


°*S Im Fall von (2.44) ist ein Korollar des Moreraschen Satzes anwendbar (vgl. z. 


B. Oscoop [32], S. 307), wahrend man bei (2.43) sich auf die folgende (leicht direkt 
verifizierbare) Bemerkung stiitzen kann: 


1 
Es sei ein fiir X(z) > O existierendes Integral der Form J(z) = | [g(u)u:—+- h(u)| du 
0 
betrachtet. Gilt hierbei lim g(u)u* —0O fiir jedes d > 0, so ist J(z) in der Halbebene K(z) > 0 
i 0 


U>+ 


analytisch und kénnen ihre alle Ableitungen durch formales Differenzieren unter dem 
Integralzeichen gebildet werden. 


Wir werden uns weiterhin auf beide Satze mehrmals berufen. 
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da und durchwegs ist f —¢'°*' (mit dem Hauptwert des Logarithmus) zu 
verstehen, wahrend das Integralzeichen mit dem Reifen auf den in positivem 
Sinn zu durchlaufenden Einheitskreis als Integrationsweg verweist. 


Be ERY OS Po aE eS 


VIII. Asymptotische Formeln. Es gilt fiir jedes positiv-ganze N nebst 
Ore 2-7 


(2. 48) 2 3(Z, n) — log (z+-n)—log z + 


= 
= erty. 1 1 

ns Le eg Beak eS 
ZG 


@tay 


y 


JSerner fiir v = 2 


Ne eg em, ws 
e{2, n)= area on Be | — — = 


(z zs rT) ide gl 


EN ee PN PETC NY SO te MONS fe 


(2. 49) ; eB 
q N+rv— n(x 
—N! ee Nee 

n1 iy Ae 
Bewels. Setzt man in (2.37) f(x)=-(z+ x)", so ergibt sich (fir 
_ geeignete z) 


PREY Eee ANT eel eT 


7 * 


a N 
Pz, 0) = | (z+x)’dx+ = 


u 


tii, MI} ‘Ht By (x) (z+x)’~ dx, 
| - aber fiir p—0O,1,2,... und N—p-+1 in (2.38) (vgl. (2.32)), fiir 
' negative p——v in (2. 48) bzw. (2.49) iibergeht. 


§ 3. Der Grenziibergang n—- x. Die Funktion /(z) 
und ihre Ableitungen 


Die erhaltenen Beziehungen fiir ¢.,(z,n) legen ganz nahe, den Grenz- 
_ tibergang n—> - zu versuchen, wobei mehrere unsere Ergebnisse sich offenbar 
~ einfacher gestalten werden. (2.21) zeigt, dai man vor allem auf den Fall 
—41 Riicksicht nehmen mu; da aber #1(z,n) bei festem z divergiert (und 
- zwar ersichtlich so, wie eine Teilsumme der harmonischen Reihe), setzen wir 


(3.1) (2) = lim [logn—3.s(z, n))* 


* Wie man weif (vgl. den nachsten Abschnitt), ist /(z) die logarithmische Ableitung 
© der Gammafunktion. Sie heiSt auch ,Digammafunktion“, ihre Derivierte ,Trigammafunk- 


_ tion“ usw. 
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und beweisen, dai dieser Limes in jedem abgeschlossenen, beschrankten © 
Gebiet @ der z-Ebene, welches keinen der Punkte 0,—1,—2,... enthalt, 


gleichmafig existiert. 
Man hat namlich 


log n —8-1(z,n) = & 


und die Abschatzung 


: es ale + 2max/z}], 
Acne (@) 


(3. 2) ‘og (1+ +] — sy 


falls 4 genug grofi genommen wird. 
Das Kriterium von WEIERSTRASS ergibt zugleich, dafi die Reihenent- 


wicklungen (z=-0, —1, —2,...) 


(3. 3) De) = —+ + =| 
oder 
keen ] ] 
p ean: = Si fi 

(3. 4) BAS) Pen 4 
mit 

: reat g ‘| 1 17 
(32D) y== lim [@41(1, 2)—logn] = > aremlog en 

en>o@ AS ? A 


gleichmaBig in jedem besprochenen Bereich gelten; y heifit bekanntlich 
Euler—Mascheronische Konstante. Es ist offenbar 


(3. 6) P1)=— 
wahrend auf Grund von (2. 4), (3.1), (3.5) 


(3. 7) {| — (7+ 2 log 2). 


(3.3) und (3.4) liefern die Partialbruchzerlegung von (z); daraus — 
erhellt, dali @(z) eine meromorphe Funktion ist, deren samtliche Pole (erster . 
Ordnung) die Stellen 0, —1, —2,... mit dem gemeinsamen Residuum —1 sind. 

Die folgenden Eigenschaften von %(z) ergeben sich unmittelbar aus 
§ 1, | bzw. IV fiir n+ ~ unter Beachtung der Definition (3.1); sie geltén 
fiir jedes z, wobei sie einen Sinn haben. : 


I. Differenzengleichung : 


(3. 8) B(z + 1)—W(z) > 3 


® Aus (3.6) und (3.8) kann man aut ¥(»)— —y + 6a(l, »—1) (v — 2,3...) schlieBen. 
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lI. Multiplikationstheorem: 
i Neth ke , 
(3. 9) a, P\z+ rood es [4 (mz)—log m]. 


Was den Fall von § 1, III betrifft, so braucht man lim 8-1(@—n, 2n). 


n—-> © 


Die Existenz folgt fiir z=|-0,1,2,... aus den vorigen und zwar ist 


(3. 10) lim 6.1(z—an, 2n) —+4 ie sq), 


w—-> © 1% 


gleichmabig in jedem abgeschlossenen, endlichen Bereich von nicht-ganzen z. 
Andererseits gewinnt man durch (2.40) bzw. (2. 44) 


1 


pa1(z—n, 2n) = co | Sees aif UU as adu= 
Sin 7eZ . eu pas 
6 cos—— 
2 
el j 
‘ apee : cos (2n +1) 1 
ah Ba | COS ZU du 
SInvEZs mtu ztn 
6 COs 
2 
und somit wegen des Riemannschen Lemmas” 
3412) lim @4(z—n,2n) — 
rae : cos (2n + es 
= lim (= ee COS ZU — COS 102 du+actg az | = 
nu-> © sin JOZ . tu 
0 COS : 
== St. ClY 902 (2z= Oia We a2 ae) 


Wir registrieren gleich auf Grund von (3.10) und (3. 12) 


(3. 13) actg az = — ao eee el, 


d.h. die Partialbruchdarstellung des Kotangens. 
Setzt man nun in (2.10) p——1 und lait n—o~ streben, so ergibt 


sich (vgl. (3. 1)) der 


tae (muy ay 
31 Der Real- und Imaginarteil von [cos (cos 7zu—cos #2) wird offenbar in 


0 <u<1 stetig, wenn man die Grenzwerte fiir u —+ 1—0 als Funktionswerte auffabt. 

~~ Auf Grund von (3.4), (3.5) kann der Verlauf von Y(z) (samt ihren Ableitungen) 
leicht untersucht worden; es la6t sich z.B. zeigen, daB alle Nullstellen von 7 (2) einfach, 
reell sind und je eine von ihnen in den Intervallen (0, 2), (—1, 0), (—2,—1),... liegt. 
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lll. Erganzungssatz: 


(3. 14) Bi—z)—P@=actgnrz (25-0, 71,72,.. a 
Aus (3.8), (3.9) und (3. 14) durch Differentiation, oder aus (2. 7), (2. 10), 
(2.11) fiir p= —v und n— ~ erhalt man einfach die entsprechenden Eigen-~ 


schaften von (v= 2, 3,...)” 
(3.15) (2) = (—1)"(r— 1)! lim 8 (2, 2) = (— 1)" 1)! 50, 2) 
(z + O, im Le om 2: Be) b 


es seien bemerkt 
(3.16) BP (1) =(—1)"(v— 1)! lim 2.401, 2) = (— 1)" 1)! £0) 
und (vgl. (2. 4)) 


(3. 17) yo? & aC PTy eI 


Die /ntegralrelationen (2.17), (2.18) ergeben durch Benutzung der 
gleichmafigen Giiltigkeit von (3. 1) 
c+] 


(3. 18) | #@dt—logz (jarg z| <2) 


mit einem die Halbachse t= 0 vermeidenden Integrationsweg, ferner 
1 


(2n)!! 


f : l 1 . 
es = Se lag nee k Rie as. pix ane oe 
(3. 19) | P(u)du lim 2 log n—log Qn—1)l 9 log st; 
it 
aus (3.18) folgt 
S san 
(3. 20) | #(u)du— > tog k— log (v—1)! (71,3. 
. k—1 


1 
IV. Potenzreihenentwicklung. Es ist 
(3°21) D(z +h) = P(A) +0 (2, h)z—C(3, h)2?+ — --- 
(1S (+1, A) 2” + Roz, A) 2” 


“2 In den folgenden benutzen wir die iibliche Bezeichnung der Hurwitzschen Zeta~ 
funktion: 


: «1 
$(s, 2) = >" ——_ (RCS) S leoae se OS ak)) 
ho (2+ A) 
welche die Riemansche ¢(s) = ¢(s,1) als Spezialfall umfabt. — (3.3), (3.4) und (3. 15) ent~ 
sprechen dem bekannten Mittag-Lefflerschen Satz iiber meromorphe Funktionen. 
(2n)!! 


3 Das Wallissche Produkt kann bekanntlich auch als a 
(2n—1)!! 


~|an_ geschrieben 
werden. 
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mit 
1 
eee n\n) dey 01 ole) 
0 
falls die Strecke zu+-h(O Su =1) keine der Stellen 0, —1, —2,... enthalt ; 
das Restglied strebt bei fixem z und h mit |z|< min |A-+-h| fiir v—» ~ gegen 
y — 0 


Ret (2, De ee = 


O und zwar gleichmdpig in jedem inneren, konzentrischen Kreis. Insbesondere 
gilt (A= 1, vo) 


03.22) P(2+1)—=—y + 5(2)z—C(3)2°+ —--- + (— 1)" Sv + 1)2” 4+ — 
(izi= 1): 


Den BEwEIs (vgl. (3. 15), (3. 16)) liefert ohne weiteres die Taylorsche 
Formel bzw. der Entwicklungssatz der Potenzreihen. 


V. Asymptotische Formeln. Man hat fiir jedes positiv-ganze N 


[e0) 


Pel ae +N! | _ By(x) 


ao), P(z)— -logz+ > He 1) 4x dx 


Ba (¥=—=2, 3,.-.) 


Nn 
eee te 2) > (— ihe "B,. ee ® = V ees — 


(3.24 * eee 
) ey | Gai ds 


Smit larg z| = 2—e(0<e< 2);™ die Restglieder sind (bei fixem N,v) O bore 


ane 


bzw. O(a} Es gelten speziell in jedem der genannten Sektoren 
(3. 25) lim [#(@)—log 2] —0, 
(3. 26) lim pe (z) =0 (GP Sed A 


|z|\>@ 


Bewels. Die Behauptungen folgen unmittelbar aus (2.48) und (2.49) 
fiir n— oo, jedoch unter Beachtung der Tatsache, dai By(x)(N= 2) nach 
der Definition (vgl. (2.36)) fiir jedes x unter einer festen oberen Schranke 
bleibt. 


34 Die Restintegrale mit »—1 in (3.23) bzw. (3. 24) kénnen leicht auf andere iibliche- 
Formen gebracht, ferner in schwach oder stark konvergente Reihen entwickelt worden. 
(Stiruinc, Poisson, Binet, Hermits, JENSEN usw.) Man hat speziell Darstellungen der Form 
Yntc,/z(z-+ 1)---(z +n) (sog. Fakultdtenreihen) zu erwahnen. 

Vb 
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(3.25) und (3.26) implizieren speziell die Limesrelationen 


(3721) lim [P(z-+ n)—log n] —0 (H(z) > 0) 
bzw. fiir jedes y= 2 
(3. 28) lim BY’ (z+n)=0 (Jt(z) > 0). 


Andererseits konstatiert man auf Grund der Definitionen sofort die 
Beschrdnktheit von: @’(z), @’(z),... in einer Halbebene %i(z)= 0 (0>0); 
insbesondere fiir jedes v = 2 
3, 29 |B) = 7-1)! S ——___ s—110(”)_ (@ EID 
Soa = a ne zy" 

Wir zeigen nun, dafi die Eigenschaften (3.27), (3.28) oder (3.29), ver- 


kniipft mit der geeigneten Differenzengleichung, #(z) und ihre Ableitungen 
im wesentlichen schon determinieren. Scharfer und genauer: 


VI. Charakteristische Eigenschaften. 
1. H(z) ist die einzige Lisung der Differenzengleichung 


(3. 30) Fe+D—F@)= S 

(z+0, —1, —2,... sonst beliebig), welche der ate 

(3519 lim [F(z + n)—logn] = 

geniigt; das entsprechende gilt iiber eae. pr (2) — — 5) aee = 
(Vere) 91 Hb (z+2)" 


== —C(v, 2) (v= 2, fest), falis man (3.30) durch 


(3. 32) Fe+1)—F@)=—, 
wdhrend (3.31) durch 

(3. 33) lim F(z+n)—0 
ersetzt. 


2. Wenn F(z) fiir alle z4-0, —1, —2,... der Gleichung (3.30) geniigt, 
ferner F’(z) im Streifen 1 = %(z)<2 vorhanden und beschrénkt ist, so hat 
man F(z)= (z) + const.: 

Gleicherweise: eine in 1 = i(z)< 2 analytische und beschriinkte Lésung 

v-1 
F(z) von (3.32) (z==0, —1, —2,...; 7=2) mu von der Form Gor Pw -V(z) 4+ 


+ const. sein. 
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BEwEls. 1. 1° Befriedigt F(z) (3.30) und (3.31), so ergibt sich 


n-1 
(3.34) F(z + n)—F(z)= 2 [Fe4 tk—1)—F(z+k)]=24(z,n) (n=1,2,...) 
und | 
F(z) = lim [F(z + n)—log n]+ lim [log n—4(z,n)] = V2), 


2° Fiir eine Lésung von (3.32) mit (3.33) erhalt man ahnlich 


F(z-+n)— F(z)= 2,(z, n) Cae 
und 


F(z) = lim F(z n)— lim 2-,(z, 1m) = ire 
bags i=0 (z 4 ie 


2. Tiefer ist die andere Halfte des Satzes. 


1° (3.30) impliziert (3.34), woraus man alle Werte von F(z) mit 
N(z) = 2 mittels derjenigen im Streifen 1 = 9(z) <2 ausdriicken kann; man 
erkennt zugleich die Regularitét von F(z) in der Halbebene Ni(Z) = = 1: 
Schreibt man aber (3.34) in der Form 


F(z) = F(z+2)—.1(z, n), 
so determiert sie die Funktionswerte F(z) eines  beliebigen  Streifens 
—h-- 1 = M(z)< —n-+2 (n—1, 2,,..) und zeigt: F(z) ist auch fir R(z) <1 
bis auf die Punkte —n (n=O, 1, 2,...) analytisch und an den letzteren be- 


sitzt sie, der Reihe nach, mit den Teilbriichen —, (eam), 1, 2: avel= 
kniipfte Pole. 


. Da die meromorphe Funktion #(z) dieselbe Pole und zugehdrigen 

Hauptteile hat, lehrt der Mittag-Lefflersche Satz, da} D(z) — F(z)—(z) eine 
ganze Funktion sein soll; wegen (3.8) und (3.30) ist ferner D(z-}+-1)—D(z) 
(z-- 0, —1,...), d. h. D(z) mit 1 periodisch. Man sieht sofort, daf D’(z) 
gleichfalls ganz ist und die Periode 1 hat; sie bleibt aber sogar, der Voraus- 
setzung nach, im Streifen 1 = 2(z)< 2 und somit in der ganzen Ebene be- 
schrankt. 

Nun wendet man den klassischen Satz von LIOUVILLE tiber ganze Funk- 
tionen an und findet D’(z)—c,, D(z) =c)z + ¢, init konstanten c,, ¢,. Erinnert 
man sich auf die Periodizitét von D(z), so entspringt D(z)—=«, d. h. 

F@)=P(2) +4, 
w. Zz. b. w. 

2° Im Fall von (3.32) schliefSt man analog, da F(z) sich in die ganze 

z-Ebene hinein analytisch fortsetzen laft und dieselben Singularitaten bzw. 


: - : : leaner = Ss Ve y = 2); daraus 
Partialbriiche besitzt, wie ay Y] @)== e ie’ Ore 2) S 


erhellt nach MitTAG-LEFFLER, dafi die beiden sich nur um eine ganze Funk- 
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tion unterscheiden kénnen, welche zugleich offenbar mit 1 periodisch ist und 
somit, gemaB der Hypothese und (3. 29), iiberall beschrankt ist. 

Der Liouvillesche Satz ergibt also: F(z)+-(7,z) (v” = 2) soll auf eine 
Konstante degenerieren, w. z. b. w. 


VII. Geschlossene Darstellungen fiir /(z). 
1. Es gelten die Integralformein: 


1 


7 ’ I —u*! Qe ~~ 5) 
(3. 35) Be)+y— | du E>), 
0) 
{ 1 
mw (, su sin 2H) rid 
apy | tg 2 [u— sin 20z ee Aye 
: (z+0, +1, +2, 

(3.36) we) +74 " ote: z= . ; ; 

_ P cos 7tu 2+} 

[5 jaws 16 ; du—2log2 

ay sin 212 


und bina fiir jedes n—O,1,2,. 


i 


| S 1 \, f., j—a ee, 
(3. 37) B@)+7— 3 (5 = 4) + | u es) eeieepe ic! (H(z) > O) 
0 
bzw. 
~( 1 aa 
(3.38) (2) tr-ei(g4- ca — ate 5 (ul2) +-2n(2)) 


(20, +1, £2,..) 


mit 
feet cos (2u + > 
oe) IE) | | sin z ee Pate arp qu, 
j cos 


%> Das ist die sog. Legendresche Formel, welche indessen erst durch Caucuy und 
LopatscHewsky streng bewiesen worden ist. — (3.35) oder (3. 36) setzt iibrigens in Evidenz 
einen Satz von Gauss, daB ¥(z) fiir rationale z mittels Kreisfunktionen und Logarithmen 
ausdriickbar ist. 

36 Fiir eine andere Herleitung und Anwendungen sei auf meine Arbeit [29] verwiesen. 
— Etwa ein Halbjahr nach dem Erscheinen dieser Abhandlung habe ich durch Professor 
A. Rényi eine gefallige Information von Professor O. Borivka (Brno) bekommen; demgemab 
benutzt M. Lercu in einer béhmisch publizierten Arbeit ({22]) bei der Auswertung 
gewisser Fourierkoeffizienten eine Formel, welche dem ersten Teil von (3. 36) (fiir reelle z) 
entspricht. 
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1 stu 


(3.40) ae fu sin saa) al veioe 
' es eae sin Zz A 


‘ges. 0 —— 
2 


Die Restglieder von (3. 37), (3.38) streben fiir n— ~ in jedem abge- 
schlossenen, endlichen Teilgebiet des Giiltigkeitsbereiches gleichmadgig gegen 
Null.” 


2. Die Euler—Mascheronische Konstante lapt sich folgendermapgen dar- 
> Stellen: 


1 al 
(3. 41) of = | ; 17 +- weal du 
0 
oder 
1 
1 2 
Micon |! * sin wxu 
(3.42) fk | we sls—| SR AXE dx) du. 


0 0 


BEwEIs. Es ist wegen (3.1), (3.5) 
(3. 43) P(z)+ y= lim [6101, 2)—2@1(z,n)] (2-0, —1,—2,...} 


n-> © 


und auf Grund von (2. 39) fiir n= 1 


1 1 


ae ipa oa | 3D 
(3. 44) 240, n)—641(z, n) = = du— | u” ae ()i(z) > O) 


a) 0 


sould ie 
mit Riicksicht auf die leicht nachweisbare Tatsache, dah Jim: Ga Toayy ) 


existiert. Die Abschatzung 


1—u*! 
(3. 45) i ere a aNt 


liefert unmittelbar (3. 35). 


37 Die Summe in (3.37) und (3. 38) soll fiir 20 Null bedeuten; dann gehen diese 
Formeln in (3.35) bzw. (3.36) ttber. Da aber fiir n—> ov (3. 4) entsteht, so handelt es sich 
zugleich um Verschdrfungen der Teilbruchdarstellung von V (2). -— iy z ein reelles Parameter 
und bildet man die gewohnliche Fourierentwicklung von (sin 12) 7 COS @x(—"#SEX S72), 
ferner die konjugierte Fourierreihe von (sin az) '(xsin hides een zx) (—-z=x = 7) an der 
Stelle x7, so sind die Restglieder eben durch (—1)"°2rn(z) bzw. (—1)""' a en(z) 

ngegeben. 
ie 38 (3.41) riihrt von Eurer her; fiir (3.42) vgl. Mikords [29]. . 
39 Das erste Integral rechts ist fiir 0 < 3t(z) <1 offenbar uneigentlich. 
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Was (3. 36) betrifft, so wollen wir mit der Formel (vgl. (2. 40)) 


1 


; eal! 
Bi, n)= sec Or 


oe Hy 
—— Stu|z— > 
2 Sin 76Z . aa ; | 2 + 


| Nth ee i4 
+(—1) cosau(z+n—s ez 


(3. 46) \ ; cos (2n-+ thee 
AoE EAN Wey sO ean COS ZU “ du + 
oa fue ie) Siieer ; ‘ wu 
é Cis 
P. 
By sinQ2atiy | | 
Ae Srna Patel Naf BOSE ys 
= sin zu | tg eo (— 1) =F du 
0 COs ef 


ausgehen." . Andererseits ergeben (2.35), (2.42) und die Substitution 


iy = He —vr) 
us 
9 ey & = | ee CUS (2n+ l)sru 
P1(Z, n) = 2: | [5 u Rage Se et a : du 
0 
S.41 <p 
wee - sin (2n-+ 1) 
it JUV aa 2 
Pal ese ee eee le 
0 Cos 57 


Benutzt man noch 


cos(20 + > » sin (2n+-1) > 
(3548); > (G1)? | seen tee eee 
( cos 1 ; sin 2* 
o 2 a “ 2 
so folgt 
Gil, n)—P.1(z, 2) —— = — - ctg srz + 
1 
(3. 49) md We sin zu 1 ov 
meee - - nti J - 
2) | aes 1 + ze FON FO +e 


CE alee Dien 


” Einen anderen, etwa ebenso kurzen Beweis ergibt die Benutzung des Satzes 
ply MAE 
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Seles ; 
} , < sell P 
stu _ COs tzu 1 sin zu 
da {cos | Ne hee | re erulL | | rel 7 
ez} und artes u ; fiir 
: Ze sin cz 2 ioe OES ayer sin 702 


u—+1—O endlich bleiben, strebt r,(z) und o0,(z) auf Grund des Rie- 
mannschen Lemmas fiir n— ~© gegen 0. 


(3. 43) und (3. 48) fiihren also zu 


1 


, 1 7 sin zu 
Denies (2) thy se pte Ne 
( ) 5) ae 2 ee? sz + ee a ul sin tz 
Nun ist, wie eine leichte Umformung zeigt, 
1 . 
=. +; “| tg > ‘sin ezu iy | du 
(3. 51) _ Sin 70z 
1 1 
: Ay . cos ae | | fee 
=r | sec—— = alin 
c| Cc 9 See —l}]du + it | (sec 5 uty = a du 
i) 5 0 
und eine Teilintegration samt 
me nt 
3.52) [tog sin -rxyax—— || ¥ °8?4™* Jax —o 
0 0 : 
ergibt 
1 1 


JEU stu JUV JtV ; 
sec = —iU tg au — 7 Hu | aes —(1—r) ctg la = 


F | 


0 


af 


log fee —— ol —¢) log sin —— ae log sin > del = = 


13-53) —=—2 a 


vicle 


=—=2 himiog [2 cos” | 4 | log sin sxx dx — 4 log 2; 
é>+0 . 


(3. 50), (3.51), (3.53).implizieren aber die zweite Gleichung unter (3.36). 
Zur Erledigung von (3.37) und (3.38) ist keine weitere Rechnung 
notig; man erhdlt sie durch Substraktion aus (3.35) und (3.44) bzw. aus 
(3.50) und (3. 49). Die Behauptung iiber die Reste ist offenbar der gleich- 
mafigen Giiltigkeit von (3.4) Aquivalent, die wir schon bewiesen haben. 
2. Auf Grund von (3. 18) und (3.35) findet man 
1 iL ME 
3. 54 ae ee Dees jdx—|| 1H" du dx. 
e Seis Ja tw 


a YW 0 
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Es ist nun miihelos einzusehen, daf der Integrand im Rechteck O=x=1, 
0=u=1 stetig wird, wenn man jedem Punkte (1,x) (0=x=1) den ent- 
eeieaict Limes x als Funktionswert zuordnet; somit folgt durch Vertau- 
schung der Reihenfolge der Integrationen unmittelbar (3. 41). 

Ahnlich resultiert (3.42) aus (3. 36). 

Man braucht vor allem der Umformung (vgl. (3. 54), (3. 8)): 
i 
1 2 
— | +1) + pax— | [+1 + WA—x) + 2yMdx 


0 
1 


— | (#0) + ¥(—x) + 27] dx + log 2, 
woher man durch (3.50) und die Vertauschung der Integrationen nach den 
zwei Veradnderlichen auf 


1 SE 


at {( sin xu 


a ——— es Sat is 
te mate pare dx du -+-log 2 


0 0 - 


(3. 55) 


Nar — 
7 iT 


~schlieBen kann. 
Beachten wir noch (vgl. (3. 52)) 


\ 1 
1 3 E 


(3: 56) = * | a) tg’ te" ae du=22 x ctg «tx dx — — 2 | log sin rx dx — log 2, 


A 0 0 
so entspringt, in der Tat, die Darstellung (3. 42). 


Es sei darauf hingewiesen, dai man aus den eben bewiesenen Grund- 
formeln mittels Modifizierung des Integrationsvariablen usw. zahlreiche andere 
herleiten kann. 


Der Vergleich von (3.41) und (3. 35) liefert z. B. 


1 


(3. 57) ‘L(z) fet (2(z) > 0), 


+ 


die bei der Substitution «—e” in eine Formel von Gauss 


(3. 58) B(2z) —_ “Yar (dt(z) > 0) 


iibergeht. 
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(3. 36) lat sich, ahnlich wie (2.40) mit »—1, in eine komplexe Kreis- 
_ integralformel umschreiben. Denn es ist nebst 0 <«¢< 1 


ls l-s vat 

| du | du 1 (8) dt 

4 A cae y ee tS 428 isc P as eyeeyp 

0 9 =1-te @ +-@ Spies (fT (t -{- ih 
~* cos nu \2—— Pre age ty i ae 
| - be wie du | | ee ae Jaw. oy (t) i Bred 
; stu ee at ee ei] i 70 J) f4+1 °°” 
0 COs ur 0 eile 


wobei f, den Kreisbogen ¢—e'7" {(—1+«s =u = 1—e) bedeutet; daraus flieft 
aber 


1 


5 oe | : fm 
G7) ++ , — TE = —— 
Peeay et 12 OR oot Ste eee ngs $ 17 ( ingen 
ee eo oy ee 


1 I 
== -—logt 
. g ek t ¢ » 5 
mit /’—e 8", t 2=e 2 


durchlaufenen Einheitskreis. 


, erstreckt tiber den ganzen, im positiven Sinn 


VU. Folgerungen iiber «ctg:cz und #(2). 
1. Man hat fiir jedes n —0, 1, 2,. 


(2) 60). 2 etg 20z = 4 (0 < Nz) < 1), 
> u I mtl 
Si lssg + pg FCO ar) 
(222 Oar loi ax) 


ferner (v = 2) 


re 


* 1 =1 * v1 pin 
(— 1) (vy— 1)! pa G+ = (log u) pad au 


6 


(3.61) Be-(z) = (H(z) > 0), 


= 

\ 

| —rre—  -+( ype "@+ oN" | 
F 

40 


A=0(z-+ A) 
le anal A ne 


mit (3.39) und (3. 40). 
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Die Reste konvergieren in jedem abgeschlossenen, endlichen Teil des 
entsprechenden Giiltigkeitbereiches gleichmdpig gegen Nall." 
2. Es bestehen insbesondere (n= 0) fiir 1 — 2, 3,... 


1 


: opel 
ne - ps 1 Z 1 l yt SS 
A 62) Cy, Z) = (v—1)! | u ! [log rm Tn du (Nz) ze 0), 


(3.63) $(v,2+1)= | 


y y- : ; val Les : 
(—1) Ie | 1 € | te HHO NIE 


It 
(il lde ae 2 8 nz) — 2 jovi \ sinzz , 


(z= 0, 11, +25 ee 

auperdem (u—1, 2,...) 

m-1 Bo, 

| 9" sem! 
) 
| 
| 


(27), wenn’ (v2 4; 


(3. 64) 5(7) = 


LS 
(=21 yce(2 arya | Bou si (u) ctg seu du, falls vy = 2u+1." 


BEwEIs. (3. 60) flieSt unmittelbar aus den Formeln (3. 37), (3. 38) durch 
den Erganzungssatz (3.14); (3.61), (3.62) und (3.63) resultieren einfach aus | 
(3. 35)— (3. 38) durch Differentiation nach z (kénnen aber natiirlich auch aus 
(2. 39), (2. 40) fiir n— ~ erhalten werden). Daf die Ableitungen der (z als 
Parameter enthaltenden) Integrale formal, unter dem Integralzeichen, auszu- 
fiihren sind, kann miihelos nachgewiesen werden. Dann die Integranden von 
(3. 36), (3. 39), (3. 40) sind fiir O< w<1 beschrankte, analytische Funktionen 
von z (z +0, +1, +2,...) und fiir die in Betracht kommenden Wertepaare — 
stetig in (z,u); in (3.35), (3.37) aber strebt der Faktor von u*! ja nach 
Multiplizieren mit einer positiven Potenz von wu fiir u—-+0 gegen Null (vg. 
die Fufinote ~). 

Schlieflich entnimmt man (3. 64) am leichtesten aus der Formel (2. 42). 
Wir finden (vgl. (2. 25), (3. 48)) 

1 


sin (2a | 1):cu 


A an(1, 0) = (—1)""(220) | [Bau(t)— BO) da 
4 Bs 
Bl ry rut Cast 
+-(—1)° (27) 2(2u)!’ 


1! Fir nO sind die in (3.60) und (3.61) rechts auftretenden Summen gleich Null 
zu setzen; unsere Formeln liefern dann einfache Integraldarstellungen, wihrend fiir m—> 20 
in die Teilbruchzerlegungen (3. 13) bzw. (3. 15) iibergehen. 

(3.64) entsteht auch aus (3.63) beim Grenziibergang z—> 0 (vgl. Mixotas [29]), so 
dafs sie als ein Spezialfall derselben anzusehen mag ; die Auswertung von ¢(v) (v2, 3,...) 
mit Hilfe der Bernoullischen Zahlen und Polynome geht auf Euter bzw. Sonin ({37], [38]) 
zuriick. Uber die Natur der Summen ¢(24-1-1), gleichwie von y, wissen wir auch heute 
nicht viel; vgl. hierzu z.B. Knopp [15], S. 246; Nietsen [30], S. 46; ferner Truespert [40]. 
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ferner 
1 


B- @ni) (1, 2) = eae (230) a | Bo,.1(u) ctg ecu du +- 


Q 


+(-1)f a)" | =e — cos (2n-+-1):eu du, 


0 


weil die beiden letzten Integrale wegen B»,,.;(0) — Bo). is|= Bot(1) =O 


(u = 1, 2,...) (vgl. (2. 27), (2. 28), (2. 29)) fiir sich vorhanden sind. Beachtet 
man nun, dai die Faktoren von sin (2n-+-1):ru bzw. cos (2n-—-1)2cu offenbar 


in }O 


l : ; 
& 5 beschrankt bleiben, so liefert das Riemannsche Lemma fiir n—-~ 
die Behauptung. 
Was (3.62) betrifft, so kann sie mit w=-e" in der Form 


jee) 


~ pv(t-z) 
ty |e tde  QH2)>0; 72,3, ..) 


bieo) <o(y, 2) =>, ———— = ——.. |— 
Be) 60.—> eae 


geschrieben werden, woher man fiir z—1 die Riemannsche Integraldarstellung 
von 5(v) erhalt.” 

IX. Trigonometrische Entwicklungen. 

1. Es gilt im Intervall O0< x <1 


und zwar in jedem abgeschlossenen Teilintervall desselben gleichmdapig.” 


@ 1 \ sin(2e +- 1) 2x 
ctg JCX af) — log [1 u sin TEX 


2. Die Fourierentwicklung von B° (x) (v=1,2,...) fiir ein Intervall 
o<x<o+1 (m>0) lautet 


(3.67) B(x) — A, + 20-—1)! & (— 200)" [Ci, Qn ren) cos 2n1x-+ 


n=] 


+ Si,(2n em) sin 2n x] 


mit 
log «, falls “71, 
(3. 68) A,= 4 (v—2)! 


wenn v=2 


[ay 


43 Jedoch kommen diesmal nur ganzzahlige Werte von in Betracht. 

44 (3.66) ist die sog. Lerchsche Reihe fiir V(x) sin «x (vgl. [21}). Von einer trigono- 
metrischen Entwicklung fiir “(x) selbst kann es offenbar keine Rede sein, da sie an x =-0 
einen Pol besitzt. 
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und 


a jee) 


(3. 69) Ci, (x) = — 
Bewels. 1. Die Funktion @(x) sin vx ist fiir Ome = 1 analytisch und 
hat fiir x ++ 0 den Grenzwert —-r (vgl. (3. 3)); daraus erhellt, dai sie oder 


dus) Sie \r Si ay 


P(x) = P(x) sin ex cos:tx in (0,1) konvergente Fourierentwicklungen 


zulaBt, also speziell die Sinusentwicklung 


(3. 70) D(x) — > by sin Avx 
A=1 
mit 
1 
(3. 71) b, — 2 | (x) sin Arx dx 
6 


bestehen muf.“ Es bleibt nur die Berechnung der Koeffizienten iibrig. 
Dazu bemerken wir zunachst, daB man durch (3. 14) miihelos ®(1—x) = 


== P(x) findet, d.h. das Bild von @(x) zur Geraden x - symmetrisch 


ist; somit folgt 


i 
2 0 


(3. 72) bo = 2) | (P(x) sin 2u 20x dx — | @M(1—x) sin 2ust (Ia dx = 0 
0 
(u 1, 2 bes} 
Andererseits entnimmt man aus (3.36) die Darstellung 
43. 73) P(x) = — (vy + 2 log 2) sin srx + 
1 
+ eh | sec fd sin sx oO u(x | 1 0 1 
= |s -| sin :¢x—cos stu | x— —— Se 
om 5 C 5 || du (O<x<1) 
0 
und durch Benutzung derselben 
: 
(3. 74) b, = — 2(y + 2 log 2) | sin? wx dx + 
' ' 0 
at Ph . 1 
+-7¢ | sec — | sin’ srx— Sin :TX COS seu | x— a | ax du - 
0 ‘Olek ‘ 
® Fir den Fall » —1 vgl. Nortunp [37], S. 107; Ci, und Si, mégen Integralkosinus 
bzw. Integralsinus (im allgemeineren Sinn) hei®en. — Nur der Kiirze halber verzichten 


wir auf die Restglieder von (3.66) und (3.67) (die entsprechenden Dirichletschen Integrale). 
4° M. a. W.: wir bilden die Fourierreihe iiber (—1,1) der aus (x) gebildeten 
ungeraden Funktion. 
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I 


= — (Vv 2 lc ») = j ae ig wu RSs l ~~ ae See 
aaa te 2) ae ae l+u 1l—ua. Ae 
0 
7 | ; 2 
= — (y-+ 2 log 2) — es log an 1| tg ** eA ae —v— log (27), 
é>+{ < 
1 i 


ar ie : 
£3. 15) Oou41 = 70 | sec | sin (Qu + NOS DA Sh can{x—| ax dit — 


OF 0 


mai | [+ - Pam of 4 | | du = - log - ae (uu ast? Je 


Schreibt man die Werte (3.72), (3. 74), (3.75) in (3. 70) ein, so entsteht 
gerade (3.66), multipliziert mit sin :rx. 

Die Behauptung iiber gleichmafige Konvergenz ist eine Folge der 
Tatsache, dai ds,.; fiir «— cc monoton gegen 0 strebt.” 

2. Es sei » eine beliebige positive Zahl. Die zu (m,m-+1) gehorigen 
Fourierkoeffizienten (a,, ,) von #~?(x) kénnen mittels (3. 4), (3. 8), (3. 18) 
und geeigneter Umformungen folgendermafen bestimmt werden: 


o+l 
\log@m fir v»—1, 


= ype ‘dx— } 5 2 
(3.76) a | pe (x)dx FBG 1) — Bo) = (y—2)(—o)'” 


A oe et is Pe 


@ 


al ide 
F 2 
P77) -0.= -2 fe eee oe eae ey” OS be aka = 
T= 
mot)" (v—1)! ore fT dv =2(v—1)!(—2na)” 'Ci,(2n 10) 


aw 
(an eae 
und dhnlicherweise 
ott 


(3.78). b, =2 } p(x) sin 2a sex dx = 2(v—1)!(—2n 0)" | Si,(2n 210) 


(itt e). 
Wegen der Regularitét von (x) (x > 0) ist nun gewif 


(3. 79) B(x) = ay + a (a, COS 2n wrx + b, sin 2n 0X) (o<x<o-+1), 


w. z. b. w. 


47 Vgl. das bekannte Kriterium von Diricuter (z. B. Rocosinskt [35]. S.” 18), 
48 Wegen gleichmaSiger Konvergenz ist die gliedweise Integration der Teilbruchzer- 
legung von yw” ") (x) bekanntlich gestattet. 
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§ 4. Die Gammafunktion 


Wie die Partialbruchzerlegungen (3.3), (3.4) und die Beziehungerm 
(3. 18), (3.19), (3. 20) zeigen, gelangt man aus #/(z) durch Integration zu 
einer Funktion logarithmischen Charakters; damit ist man zur Idee gefiihrt, 


exp | W(z)dz zu bilden. Wir betrachten genauer 
f wea 
(4. 1) [(z)=e (= 0, — 1) 3a) 


(Gammafunktion) mit einem rektifizierbaren Jordanschen Kurvenstiick als. 
Integrationsweg, welches zwischen 1 und z fiir O0< argz = zt ganz oberhalb, 
fiir —:<argz<0O ganz unterhalb der reellen Achse verlauft.” Somit ist 
namlich wegen (3. 20) 


(4. 2) rO=6—hi y=. 25), 


d. h. (4.1) bietet eine duferst einfache Fortsetzung der Fakultdt (als einer 
zahlentheoretischen Funktion) ins Komplexe. Wir schreiben zunachst die aus 
(3. 18) bzw. (3.8) unmittelbar flieSende Grundeigenschaft hinzu : 


I. Differenzengleichung : 
(4. 3) P(z+1)=2zl(2) (z=- 0, —1, —2,...). 


Es verdient ferner den iiblichen speziellen Wert (vgl. (3. 19)) 


(4. 4) | rls} “ 


zu erwahnen. 
Benutzt man die (gleichmabig giiltige) Limesdefinition (3.1) von (z), 
so ergibt sich durch (2.15) 


= faye nat n! 
(iz) =lim |r es | lim Jc! = fe oe Es 
(4. 5) NW» OD n> CO z(z+ 1)---(z+-n—1)_ 
WE 
lim wo (z+ 0,—1,—2,...)s 


reo 2G V-@E A) 
Das ist die Gaupsche Form von I(2). 
Integriert man, nach zweckmabigen Umformungen mittels (3.8), beide 

Seiten von (3.3), (3.4)” und beriicksichtigt nebst (4.1) /'(1)=-1, so folgt 


Das Integral hangt mithin vom Weg nicht ab und ist bekanntlich eine eindeutige, 
regulare Funktion von z. — Wir erwahnen zugleich die Umkehrung von (4. D2 22) 


d i 
log I’ (z) = ——_.. 
dz 


DIE GAMMAFUNKTION, DIE RIEMANNSCHE ZETAFUNKTION UND VERWANDTE FUNKTIONEN. | 415 


nach Ubergang zu den Exponenten 


ie ae 
(4.6) Tiel TT ‘ =e Jf ae 
aml 1 da oad nl 1 +5 


aus der letzten Beziehung entnimmt man eh (4. 3) die ‘iiss ase he Produkt- 
darstellung von I(z)': 


(4. 7) 


1 E 
Fey 20 L(t Fe. 

(4.6) und (4.7) gelten offenbar fiir beliebige z=-0,—1,—2,... und 
zwar in jedem, die Ausnahmepunkte nicht enthaltenden, abgeschlossenen, 
endlichen Bereich gleichmabig. (4.7) setzt in Evidenz, daB /’(z) ' eine ganze 
{transzendente) Funktion ist, deren alle Nullstellen einfach und in 0, —1, —2,... 
gelegen sind. Daraus erhellt aber, daB /'(z) bis auf die genannten Stellen 
liberall reguldr und in z= —2 (4—0, 1, 2,...) mit einfachen Polen versehen, 
also meromorph ist. Uberdies ersieht man /’(z) = 0 fiir jedes z und / (z)>0 
fiir z>0. 

Das Residuum an 0, —1,—2,... errechnet sich bequem durch die aus 
44.3) entspringende Relation 
(4.8) P(z+44+-1)=—2(24+-1)---2@+/4T() (hime 0 152% 2.) 5 
man erhdlt wegen /"(1)— 1 

res [(z) = lim (z+ 4)I'(z)= 
a Be tee ee le 0,102, 
ay, 2(2¢ 1)-- (2-2 —1) A! 
Mithin liefert der Mittag-Lefflersche Satz die Teilbruchzerlegung der Gam- 
mafunktion : 


(4. 10) Lye (2)-— 


Ser 1)’ 1 D1 
ADR Tae, 
“wo g(z) eine geeignete ganze Erion bedeutet und die Reihe rechts offen- 
bar in jedem endlichen, abgeschlossenen, die Ausnahmepunkte nicht enthal- 
tenden Bereich gleichmahig konvergiert. 
Weitere Eigenschaften von /‘(z) findet man einfach durch Integration 
aus den entsprechenden Beziehungen des vorangehenden Abschnittes ; die 
dabei auftretenden Integrationskonstanten sind aber stets zu beachten.” 


(25201 2,533), 


” Die gliedweise Integration ist durch die gleichmaBige Konvergenz der betreffenden 


Reihen ermoéglicht. — Die Darstellungen (4.6) verdankt man Evter und Gauss bzw. 
 ScHLOMILCcH. 

't (4.10) riihrt von Prym her. 

2 Die folgenden Sitze gelten iiberall, wo sie einen Sinn haben. — Bekanntlich hat 


(4.11) samt (4.3) schon Euter gefunden, wahrend (4. 13) fiir z—0 von Euter, fiir m—2 


‘yon LeGenpre, allgemein von Gauss festgestellt worden ist. 
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Il. Erganzungssatz: 
(Qi a = +0, +1, +2,...). 
(4.11) | E@) Be) eae (z==0, +1, +2,...J 


BewEls. Es folgt aus (3.8) samt (4.1) und (4. 4). 
Die Formeln (4.11) und (4.7) oder (3.13) selbst implizieren die wich- 
tige Produktdarstellung der Sinusfunktion : 


(4.12) sin 272 =z I(t ae) 
aA=l Lo 
lll. Multiplikationstheorem: 
m—1 mt 1 : 
(4. 13) Lg (2+ 4). =(22)2 m2 I'(mz) (z+0,—1,—2,...)4 


Bewels. Der Fall m-~1 ist trivial; es sei in den folgenden m>1 ange- 
nommen. Fihrt man in (3.9) die Gammafunktion hinein, so ergibt sich 


m1 


(4. 14) [Hr \2+=|=cum=6(mz) 
k=O M ) 


mit einer vorlaufig unbekannten, offenbar positiven Konstante C,,; es eriib— 
rigt nur noch die Berechnung derselben. 


Man verwendet zu diesem Zweck (4. 14) fiir z= und gewinnt wegen. 
ed 1 es 


m—1 


(4. 15) Ir \- — Gr 
oder anders geschrieben 
m1 
] 
4.16 “| ah 
(4. 16) 1) tore 


Hieraus erschliefit man durch (4. 11) 


(4.17) ir far (-4\-77 =a Ale 
sin — : 


Der Zerlegung 


m-1 hz ne 


(4. 18) mJ = =H: —e™ 


entnehmen wir aber speziell 


ne | Qa Me 


I l—e™ M2 sin ca = im a | == IMn,_ 
also “s 
mae iow Bs m 
(4. 19) Si fh sosigiee aeetien 
till m on -1? 
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setzt man dies in (4.17) ein, so coe 


m- =1 
Cy, =m? > (2: t) 2 


WZ. b.- W 


Nach (4.1) kommt das Integral im Exponenten unter den (unendlich 
- vielen) Logarithmus von /(z) vor; wir schreiben weiterhin eindeutigerweise 


(4. 20) Log 1(z) = [wat 


indem nur die schon erwahnten Integrationswege zugelassen sind.” 
Dann gilt die (3.18) analoge Raabesche Integralformel : 
+1 


(4. 21) J Log I'(t)dt =z (log z—1) + log 2 (jarg z| < 2), 


welche man bekanntlich am schnellsten mittels (4.13) herleiten kann. 
Da namlich (vgl. (3. 18)) 


s+1 e+1 


7 Log F(t)dt = | B@yar— | W(tdt—logz _ (jargz|-E 2), 
; : 
also gewifi 


(4. 22) rie I(t)dt =zlogz—z-+c 
mit konstantem c westehe ist es nur c= log 2 nachzuweisen. 
Nun ergibt (4.22) fir z>0, z++0 
1 
(4. 23) c = Jlog I'(u)du 
(damit ist die Existenz des rechtsstehenden uneigentlichen Integrals gesichert) + 


andererseits aus (4.13) mit z— - bekommt man, in der Tat, 


1 
m-1 


(4. 24) Jtogr (u)du lim 5, oe log I (i |- 5 log (20). 


Wie § 3, IV, erhellt ohne weiteres auch die folgende 
IV. Potenzreihenentwicklung fiir Log /(z). Man hat 
Log F(-+h) = -Log I(t) + B(h)z +4 502, bz: + 
4.25) ay 
+ SY ce, tert Reale We 


53 Es ist also jedenfalls Log 7(1)=—0, ferner Log /°(z) = log F(z) (reell) fir z>0. 
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mit 
1 


Rea (2,2) = : | p (zu-+-h)(A—u)’ du (v=0,1,2;5068 


ao 


falls die Strecke zu+-h (0 =u =1) keinen Punkt der Folge 0, —1,—2,.. 
enthdlt; das Restglied strebt bei fixen z und h mit \z)< min |4-+-h) fiir 


YS Re 
y—> ox gegen 0 und zwar gleichmdpig in jedem inneren, konzentrischen Kreis. 
Speziell (h=1, 1 >~) 


Log P(z+1)=—yz+ 
4, 26 C 2 ¥& / | | . Db 
( ) NO ate --» + (—1) we ae (|z}<1). 


Wir bemerken zunachst, dafi man aus (4. 26) durch leichte Umformun- 
gen offenbar noch besser konvergente Entwicklungen gewinnen kann. 


V. Asymptotische Entwicklung fiir Log /‘(z). Es gilt ftir jedes post- 
tiv-ganze N 


Log I'(z) - pe |iogz—z-+ log /22e + 
{4, 27) 


B,. be 


By e 
Dane 


a (N=)! - ax 


jee 
mit jargz| = s7—e (O<e<:0); das Restglied ist bei einem festen N=2- 


O le . Insbesondere besteht in jedem der genannten Sektoren 
Asa 


2| 


wihrend fiir z—n-+1 (n—0O,1, 2,...) 


(4. 28) lim e Pj —|7— : log z+ z2—log | 2ee| — (), 
|z|-»00 


(4. 29) niw~ | 2: in( 2 ) a 


4 Natiirlich kann auch /(z) selbst nach dem Taylorschen Satz entwickelt werden, 
wobei aber die Koeffizienten sich nicht so einfach beherrschen lassen. 

® (4.27), (4. 28), (4. 29) pflegt man auf gleiche Weise als Stirlingsche Formel zu 
bezeichnen; die Allgemeingiiltigkeit von (4.27) wurde erst von Stiectyes erkannt. Durch 
Umformung und zweckmabige Entwicklung des Restes erhalt man andere iibliche Integral- 
darstellungen bzw. Reihendarstellungen fiir Log (z) (Binet, Burnsipe 


, GuDERMANN usw.). 
Fiir die Abschatzung des Restgliedes vgl. z. B. Léscu—Scuosuk [26]. 
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BEWEIS. Die Integration von (3.23) liefert (vgl. (2. 27)) 


fwmat == [= + log z—z+K+- 
(4. 30) 


N 


y Bi seed, = | oe 


fiir jedes N—1,2,..., falls der Integrationsweg ganz in einem Winkelraum 
jargz| = 7—e (0<e< 2) verlauft; K bezeichnet hierbei eine (fiir alle in 
Betracht kommenden z eindeutig bestimmte) Konstante. Man hat nur ihren 
genauen Wert zu ermitteln, da die Behauptung tiber das Restglied und somit 


(4.28) und (4.29) wegen |By(x)| = ae tN) (N = 2) (vgl. (2. 36)) ja evi- 


dent sind. 
Verwenden wir (4. 30) mit N= 2 fiir z—n-+1 und lassen n—> > stre- 
ben, so entspringt die Formel 


’ 


AK=lim Hog ni —[n+5 |log n-+-n 


n> © 


-setzt man noch in der Klammer 2n  statt n, multipliziert beiderseits mit 2, 
so folgt nach Substraktion (vgl. (2. 18), (3. 19)) 


kK ==lim 2 log n!—log (2n)! + 2n log 2— > logn +5 log 2|- 
i ; 


veh 1 I * 
(4. 31) reese | P1(u, SS a log 2 = 


1 


= | P(u)du + log 2 —F-log (27), 
w. z. b. w. 


Es sei h >0, z beliebig, aber fest. Schreibt man in (4.28) A bzw. 
z--h statt z, so ergibt eine Substraktion 


1 
lim |Log I'(z+h)—Log P(t) —zogh—[2+h— 4] log(1 +2}42| = 
h>o . d / , 
= lim [Log (z+ 4) —Log ['(A) —z log h] —0 
h>@ ‘ 
oder | 
(4. 32) P@-Bh) ~ Th) ilies Bearos), 


13 Acta Mathematica VI/3—4 


420 M. MIKOLAS 


eine asymptotische Relation, welche sich samt der speziellen (4 = n~-- 1, posi- 

tiv-ganz) 

(4. 33) P(z+tn+1)waln (n—~) 

oft als niitzlich erweist.” 
Was das Verhalten im Unendlichen betrifft, so verdient es noch eine 

elementare Tatsache zu erwihnen, namlich die Beschrdnktheit von I’(z) in 

jedem fixen Streifen O< J}=R(z) = M; dies leuchtet sofort ein, falls man 

die aus (4.6) wegen |e|=e®© und |z| = |It(z)| folgende Abschatzung 

(4. 34) P| =|LHE)| (z= 0, —1, —2,..2), 

gleichwie die Stetigkeit von /(z) auf der positiv-reellen Achse beachtet. 
Wir zeigen nun, dafi die Fundamentalgleichung (4.3) zusammen mit 


(4. 33) oder der Regularitét und Beschranktheit z. B. in 1= H(z) < 2” schon 
ausreicht, die Gammafunktion zu charakterisieren. Genauer: 


VI. Charakteristische Eigenschaften. 
1. /'(z) ist die einzige Lésung der Differenzengleichung 


(4. 35) F(z-- 1) =2F@) 
(z= 0, —1, —2,..., sonst beliebig), welche der Bedingung 
(4. 36) ime a) oe 
n—-> 0 nin 
geniigt. 


Zs Befriedigt eine Funktion. F(z) fiir jedes z3-0, —1, —2,... die Glei- 
chung (4. 35), ferner ist sie im Streifen 1 = R(z)< 2 reguldr und beschrénkt, 
so mups F(z)=cl(z) (mit konstantem c) sein. 

BewEIs. 1. Aus (4. 35) folgt 

F(z+n+1)=2z(@+1)...@+a)F() (n= 0, 1 2a 
woher man durch (4. 36) und (4. 5) 
al meee 


F(z) = lim —— = 
(2) =i ae 


emer pe NY SY eee 
schliefen kann. 


P(z) (20, —1, —2,...) 


2. Fiir eine einfache Uberlegung beziiglich der anderen Behauptung, 
welche, ahnlich § 3, VI, den Liouvilleschen Satz benutzt, wollen wir auf die 
einschlagige neuere Literatur verweisen.™ 


© (4. 33) kann iibrigens auch durch (4.5) und (4.8) leicht erhalten werden. 

*? Ein beliebiger anderer Streifen o =< #(z) < @ +1 (@ >0) ist aber ebenso gut ge- 
eignet. 

58 Vgl. Knopp [16], S. 47; der dortige Beweis riihrt von H. Wietanpr her. — Die 
erste Halfte dieses Satzes VI scheint mir vom Prym, die zweite aber von ScHEEFFER [36] 
gefunden worden zu sein. 
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Vil. Integraldarstellungen fiir Log /'(z), Log sin /rz. 
bees Olt 


1 


(4. 37) Log [°(2) — | 


O 


1 
log u 


ae —«-1) du (R(z) > 0). 


Ferner fiir 0<z<1 und beliebige nicht-reelle z 


: | 1 A 
(4. 38) Log J'(2) = > [log = — Log sin e2| —zlog 2+ 
j 
1 2 
| j in 2 i 220 
es | | tp 28 eB xu sin 27exzu )axdu 
; 2 Westies Si 2 7nce », 
0 0 
mit 
(4. 39) Log sin 2727=— at | ctg zt at; 


tol = 


der letzte Integrationsweg soll ein rektifizierbares, Jordansches Kurvenstiick 


sein, dessen alle von 2 und z verschiedenen Punkte oberhalb, auf oder unter- 
halb der reellen Achse liegen, je nachdem O<argz<a, argz—O bzw. 


—st<argz<0O ist. Mithin besteht die Beziehung 


>I) = 


1 


ye fs : UU 
TAZ) = 2: eee ap OP 72 | | tg 5 


4. 40 2. oh 
( (O<e2-— 1), 


‘sinsrxu = sin 2xzu 
: — — adxdu 
Sin 70x sin 22xz ; 


falls die Wurzel positiv gewdahlt wird. 
Allgemein hat man (n = 0, 1, 2,...) 


(4. 41) Log re+)——y2+ >| 2 —tog(1 +2]|+2.@ 


EE 


59 Also speziell Log sinwz—logsin zz (reell) fiir O=z<1 und Logsinzz= 
— log sin 7z-++2k i (mit einem geeigneten ganzen &) allgemein. — Beachtet.man, da die Funk- 

| 1 
tion sin zz mit 1 periodisch ist, ferner auf den Geraden ‘i (z) = 2v— . (G— OMe aaa) 


‘und nur auf diesen negativ wird, so kann man den Weg, welchen sie bei der Integration be- 
schreibt, miihelos auf der Riemannschen log-Flache verfolgen und somit den Wert von k 


genau bestimmen. 


13% 
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u" Sh aS eS 
. 1—a [2 it ie u =| du i Gh O 
(4.42) Pi(z) => — 1 
lee 


Ae (r,.(zu) +0,(zu)\du” fiir —1<z<1 
) und jedes nicht-reelle z. 


2. ES*1St 


1 = — 
log u 1—u 


(4. 43) Log sin 7z= log wt] (0< R(z)<1) 


und allgemein (n=O, 1, 2, . 4 
(4. 44) log sinsztz = log(zrz) + ~~ fog | 1+ 2 \4 log| — 2) + Qn(Z) 
1 A k 


mit 


1 
| iG Bie re du fiir O<z<1 und nicht-reelle z mit 
|. (1—u)logu < H(z) <1, 
(4.45) Qu(2)=4' poke: 


1 
(1) nz | r,(zujdu fiir O<z<1 und jedes nicht-reelle z. 
3. Die Restglieder P,(z), Q,(2) streben in jedem abgeschlossenen, end- 
lichen Bereich der zugelassenen z-Werte fiir n—- oo gleichmdpig gegen Null. 


BEwEIs. 1. (4.37) folgt unmittelbar aus (3.57), wenn man unter dem 
Integralzeichen von 1 bis z integriert. Daf dies erlaubt ist, kann leicht nach- 
gewiesen werden (vgl. Fufinote “); denn 1° der Integrand in (4. 37) fiir 
uz—»1—O einen Grenzwert besitzt, was die Existenz von : 


if 
nee | eo 
Jo=| ogg | ew De 


fir X(z) >O sichert; 2° es besteht lim uw’, (1—u) log u—0 (#>0); 3° somit_ 


u-> +0 
gilt J"(z) = H(z) (R(z) > 0); 4° J/(t) =Log (1) =0. 
Schreiben wir (3.36) durch (3.42) und (3.56) in der Form: 


0 g* 


(4. 46) iE (@)\ eae eho —log 2+ 
2 ae 
i + 
wu Sin 70x u Sin ZU 
+F| a) « J Sinerx ise sin 12 aH 2 = 0,21) tere 


GOP Voll (3539) 5G: 40). 
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: vere Bis 
so liefert eine Integration von > Disee,. 


ji ; 1 : 
(4.47) Log I'(z) +| P(t)dt— — a (Log sin rz + log z)—z log 2 + 
1 
a 
Eft TH a2 ene UXU ne sin att ile 
Sin 70x sin srt 
(Zz, 2) = ee, existiert gewif, wenn der Integrationsweg geradlinig 


und 0<z<1 oder z nicht-reell ist. In diesem Fall ergibt eine leichte Inte- 
graltransformation und die Benutzung von (3.19) genau (4. 38), welche beim 
Ubergang zur Exponentialfunktion fiir 0<z<1 offenbar in (4. 40) iibergeht. 

(4.41) mit (4.42) erhalt man einerseits aus (3.37) durch Integration 
von 1 bis z, indem z schlieflich durch z+1 ersetzt wird, andererseits aus 
(3. 38), falls man sie (vgl. (3.8)) in der Form 


A zth 
(eee Osada 2, 3) 


schreibt und dann von O bis z (geradlinig) integriert. Das Restintegral 
; 1 


B48) wery——7t 3 (5 —1]+ S40.) 


(4. 49) l[n@)+ en(t)]dt—z | [r.(zu) +0,(ew))du 
0 0 
ist wegen lim [r,(t)-+0,(t)] =0 fiir —1<z<1 und jedes nicht-reelle z vor- 
tO 


handen. 
2. Aus (3. 18) und (3.14) gelangt man durch Integration von 1 bis z 


bzw. von 2 bis z und durch Benutzung von (3.18) bzw. (3.19) zu den 


Relationen 
(4. 50) Log P(z+1)—LogI(z)+logz (z+0,—1, —2,...), 
(4. 51) Log I’ (z)-+Log Ll’ (1—z) = log — Log sin 7rz 


(0<z<1 oder z nicht-reell) ; 
sie implizieren 
(4. 52) Log sin rz = Log (7z)— [Log (1 +z) + Log F(1—2)}. 
“1 Fiir die hiesige Integration unter dem Integralzeichen vgl. Oscoop [32], S. 307. 


62 Macht man auch von anderen Integrationswegen (z. B. Kreisbogen) Gebrauch, so 
l4Bt sich eine fiir jedes nicht-ganze z giiltige (aber zugleich kompliziertere) Formel aus 


(4.47) gewinnen. 
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Verkniipft man nun (4.51) mit (4.37) bzw. (4.32) mit (4. 41)—(4. 42), 
so entstehen gerade (4. 43) und (4. 44)—(4. 45). 

Die Behauptung, dai lim P,(z)—0O und lim Q,(z)—0 in den bespro- 
chenen Bereichen gleichmafig bestehen, ist ein Korollar der gleichmabigen 
Giiltigkeit von (4.6) bzw. (4. 12). 

Somit ist der Beweis vollendet. 

Wir bemerken zunachst, dali (4.41)—(4.42) und (4. 44)—(4. 45) als 


Verschadrfungen der Produktdarstellungen (4.6), (4.7) bzw. (4.12) aufgefabt 
werden kénnen, indem man die entsprechenden logarithmusfreien Formeln 


(4. 53) Pe+1)=e ie 
‘ —T 1 oy, cs 
(4. 54) Sin 72 = 70Z ek II 1— 2) 
At . 
betrachtet. 


Was (4. 38) betrifft, so lat sie z. B. eine Reihenentwicklung fiir log /’(z) 
zu, welche fiir numerische Zwecke vielmehr brauchbar ist, als (4. 26). 

Es ist namlich, wie man sich davon mittels (2.22) leicht iiberzeugt, 
fiir jedes u 


sin stu S : u+1 - 
(4. 55) Se 2> taal) Boyss| “3 | (Qeet)* (jé| <1) 
und hiermit 
= LSI7et re S u (2: on u+l1).,, 
Sz aes (fous StaGet dt=uz-4 2. zai aol) Sal Bx, a: D ) 2 : 


0 
nebst |z|< 1 und geradlinigem Integrationsweg. 
Setzt man dies in (4.47) ein und beachtet die Darstellungen (3. 63) in 
der Form 
1 : 


(4.56) t(2u-+1)=(—1)'2*2 ae: oe Bau it: "| au (u=0, 172 aa 
so ergibt sich” 


: 1 
log /’(z) say (log :rx— log z— log sin rz) — 
(4. 57) | 


any - No S(2u+1) | 1 Qu Fe . 
Zlog 2-2 2 Ens cA Skies (O= 2-1): 


"8 Die ausgefiihrte gliedweise Integration ist (gema6 leichten Abschatzungen) | 
gestattet. (Vgl. Mixotas [29], S. 156.) ; 
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oder, durch Verwendung von (4.50) und 


/ log el + 2z)— log (1—z) = 2 5% pul (\z| < 1), 
die Entwicklung 
, l vg {eee 
log P(z+1)= | ae 
(4. 58) tel acd) 2 O98 Sinz AUS peso 
——Ar aS G(2u-+1)—1 See 2 - 
uh Gaeat Sioss = Dad pee te atl) 


Das ist die sog. Legendresche Reihe fiir log '\(z-+1). 


Vill. Trigonometrische Entwicklungen fiir log [(x). Es gelten die 
Forieln 


ne 1 a— { \: 
10e J (x) == > log z+ (y+ log 2) & =o — Flog sin 7x + 


(4. 59) 
Sees cee sin 2uzcx (Oe x =i)" 
2 i= uw 
* 1 250 
log 7 (== 5 log o+xlog a+ 
(4. 60) a) 


1 
ae => [Ci,(2nz@) sin 2nax— Si,(2ns) cos 2nzx]” 


und zwar in jedem abgeschlossenen Teilintervall von (0,1) bzw. im ganzen 
[o, o+ 1] gleichmdapig. 

BEweEIs. Die fraglichen Beziehungen lassen sich fast unmittelbar aus 
(3. 66), (3.67) entnehmen. 


1° Integriert man in (3. 66) beiderseits zwischen den Grenzen 5 und x 


langs (O,1) und beachtet die gleichmafige Giiltigkeit dieser Formel, so folgt 
(vgl. (3. 19)) 
log P()—F log x= 
_ (4.61) 
Pee tls gee 1 sin (Qu-+ I) acu 4 
= (y+ log 2a)| 4 —x x) — 5 log sin ax— 3 tog(1 + 4) Speyer 


rv 


Nun liegt es nahe, die Identitat 
. i Sa sill (Ziel ee 
= [log 08 (ol) laa 


~ sin (2m-- 1)2x 
—2 > (log «) cos 2ux— log (m+ 1) oe aul 
p=2 


(4. 62) 


“4 Das ist die beriihmte sog. Kummersche Reihe. 
“> Fiir die Bezeichnungen vel. tS) 8h IDG 
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und die Abschatzung 


i 2 : sin (2m -- 1)ztu du | = 
sin 7cu 


bo) me 


1 
i 2m+1 


cos (2m -+ 1) zx 


(4. 63) gt Sin 70X 


cos tu 

# — cos (2m-+ 1)ztu du} < 
J sin?’ zcu 
1 


9 
“a 


opel ( 1 ee eee | Ox xe) 
=3mee1 _7e| sin zex| +1 SiN 2TX | , One oy 


zu verwenden; man erhdalt 


. \¢ sin (2u+1)cu — Nlogu 5 
eo =e log(1 ; +){ sin stu eh ieag es rou SUN: 
i 


und mithin (4. 59). 


Da eee fiir «—3,4,... monoton abnehmend gegen Null strebt, ist 


auch die alelchinabips Konvergenz von (4.64) in einem beliebigen  Intervall 
&<x<1—ée (¢>0) gesichert.” 

2° Durch Integration bekommt man aus (3.67) mit y= 1" 

log P(x) =e +x log w+ 

=> Ps [Ci,(2nzv@) sin 2nax— Si,(2na@) cos 2nsx| 

(0<m<x<o@-+1), 
wobei c, eine geeignete Konstante bezeichnet. Ihre Bestimmung gelingt ganz 
leicht, indem man von @ bis m-+-1 integriert und sich auf die Raabesche 
Formel (4. 21) stiitzt; es resultiert 


; 1 
(4105) es eee 


it 


(4. 66) cyan loa 


Die rechtsstehende Reihe in (4.65) ist ihrer Entstehung nach (als eine 
integrierte Fourierreihe) fiir jedes reelle x gleichmdpig konvergent™ und stellt 
eine iiberall stetige, mit 1 periodische Funktion dar; letztere hat also fiir 
xo und x=m-+1 den Wert log ’'(w)—(@-+ © log w)= log P'(w + 1)— 


“6 Vgl. z. B. Rocosinski [35], S. 18. 
"7 Die gliedweise Integration der betreffenden Fourierreihe ist bekanntlich gestattet. 
“8 Vgl. z. B. Rocosiski [35], S. 27; dies kann man auch durch das Weierstrafsche 


Kriterium miihelos nachpriifen, weil es fiir die Koeffizienten mittels Teilintegration o{-) 
n2 


herauskommt. 
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—leo+ (+ 1) log m] und stimmt auf solche Art im ganzen Intervall [w, m 4-1] 
mit log /’(x)—(c. +x log m) tiberein, w.z. b. w. 
Nun wollen wir uns mit der Teilbruchreihe in (4.10) beschaftigen. 


IX. Geschlossene Darstellungen der ,,unvollstandigen Gamma- 
funktion“ 


oui)! 
SES Py a 


Man hat 
1 
(4. 67) C2) = | roe“ ou (H(z) > 0) 
und ‘ 
1 

(4.68) G(z)= sin wz. esticos(xuz+sinzu)du (z=-0, +1, + 2,...). 

Allgemciner gilt (n= 0, 1, 2,...) 
(4. 69 ey eS 
( ) G(z) = ual Zh | g,(Z) 
mit 


oO 0 


{ (= \ oa F 
| Saar Pe | | Ga) ae axa sir = N(z) 0 
J 


1a 


(4.70)  qQn(Z)=1 \ 
ee {J (exe cOs(au (ean Dr 


n! sin 0z 
00 
--xsinztu)dxdu fiir jedes nicht-ganze z. 


Die Relation lim q,(z)—0 besteht gleichméipig in jedem abgeschlossenen, 


1 —> © 


endlichen Bereich der zugelassenen z-Werte. 


Bewels. Man benutzt aufs neue unmittelbar die Identitéten (2. 43), (2. 44), 


ferner die fiir jedes n—O,1, 2,... und fiir alle & geltende Beziehung 


t 
; role cnt] 
é Sane a n p-§& 
(4. 71) et : : qa ran ee ax, 


welche mittels partieller Integration oder aus der Taylorschen Formel leicht 
gewonnen werden kann. 


“9 Allgemeiner benutzt man dieselbe Bezeichnung fir die (bis auf 20, —I, ain 
Sen 0 
+. ict] de mme vv 

iiberall existierende) Su =, Sate gee i 


- (» > 0), welche fiir t(z) > 0 auch durch die 


@ 
Integraldarstellung | xe “dx definiert werden kann. 
0 
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1° Aus (4.10) entspringt einerseits durch (2. 43) 
1 1 
] 


Pi as. 
(4.72) G@=> Sau ue nl e(>! a ) du — | ee sp: 


i) 0 
()i(z) > 0), 
da die gleichmafige Konvergenz der hierauftretenden Potenzreihe die Ver- 
tauschung der Summation und Integration zulaft; zugleich ist die Existenz 
des letzten (fiir 0 < 2(z)<1 uneigentlichen) Integrals gesichert. 
Andererseits folgt durch (2.44) analog fiir jedes nicht-ganze z 
: 


G@= sp => p MS, i 5) cos seu(z+-) du = 
(4. 73) : 
aE) * (> COS : eT Oa 
"sin Zz. A! : 


so gilt aber fiir beliebige u, z 
> | 
(4. 74) dpe i) panes 


A=0 
also 


7 = eos ™ COS (sruz + sin zu), 


womit (4. 73) in (4. 68) tibergeht. 
2° Fir die entsprechende n-te Partialsumme erhalten wir durch (2. 43) 
und (4.71) (§==—u) ohne weiteres 


l 


SO eS cals 


ie) - 
5 COS 7EU(Z+- 4 ete ha aia : iz 

(4.75) “ IS IU (6 a yo ena +e taupe” “4 )= 
AD 


roar PO Barc. rt < 
(4. 76) 2 : 
. n+1 . 
= | ate" |'1— her) | ex) CU: ; 
‘ n! 
0 0 
Die Verwendung von (2. 44) liefert dagegen 
1 
(4.77) a eat 8 mu | S COS : ue +h) yy 
0 AL zta sin zz J \t=4 


und betretfs der Summe in der Klammer gewinnt man wegen (vgl. (4.71)) 
1 
Nv ve regspitu bee f i ; 
(4. 78) pe * eimlz+A) — einen ier hana xe wel ty 


A=0 
0 
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mit Riicksicht auf die Eulerschen Relationen einfach die Darstellung 


Vb 
ab ; =e : 
2 Gy COs eu (z+ A) = eS" cos (ruz-+ sin su) — 


1 


(4.79) 


— i" (1 —x)"e"S*" cos ((2-+-n+ 1) 2u+x sin u)du. 
0 

Vergleichen wir (4.67) mit (4.76), ferner (4.68) mit (4. 77) samt (4.79), 
so kann durch Substraktion gerade (4.69) mit den Restgliedern (4. 70) gefol- 
gert werden. 

3° Die Behauptung, dah q,,(z) fiirn— ~ gleichmabig gegen Null strebt, 
ist ein Korollar der gleichmafigen Giiltigkeit von (4. 10). 

Es liegt iibrigens auf der Hand, das Integral (4.68) in ein iiber den 


Einheitskreis erstrecktes Kurvenintegral umzuformen; wir schreiben (vgl. (4. 75)) 
1 1 


: 1 ees ; 7 
ecosa4 cos (cuz + sin tu) du = > | (eines ab goers) it 


0 0 


(4. 80) 


also, durch Benutzung der Substitution f—e'", 


z-1 ft 


(4.81) G(z)= edt, 


SO Tsin re: 


wobei ¢ —e' 8’ zu beachten ist. 


Was die Bestimmung der bisher naher nicht gepriiften ganzen Funktion 
2@(z) in (4.10) betrifft, so kommt man am natiirlichsten Weise zum Ziel, 
indem man die Differenzengleichung von G(Z) betrachtet.” Man erhait nam- 
lich durch (vgl. (4.67)) 


1 


> ‘ 1 ‘ 
(4. 82) (zu1—w)je"du—[we", i= (H(z) > 0) 
die Relation 
, ae! 
(4. 83) ZGlZ)e— 27, l= 


(Ty 1 : : Ora: 
welche, wie die Darstellung e@=>4 ae eae) zeigt, zugleich fiir jedes 


z+0,—1, —2,... gilt. 


70 Es ist von vornherein zu erwarten, dab G(z) einer (4.3) ahnlichen Beziehung 
geniigt. — (4. 83) riihrt von Prym her. 
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Wird nun eine Lésung der Differenzengleichung von /(z) gesucht, so 
1 


hat man offenbar nur die obere Grenze in Jute"du auf solche Art zu 


0 


modifizieren, daB w’e auch an dieser verschwindet. Hiermit gelangen wir 
zu den folgenden 


X. Integraldarstellungen von /'(z). Es ist in (4.10) 


(4. 84) g(z)—|uterdu —(z beliebig) 
I 
und so 
(4. 85) CeZy= | iP esa (Ji (z) > 0)," 
1 co 


(4. 86) Li2)e— gree | eS" cos (tuz+sinztu)du + | uwe"du 


0 1 
(220) steele ene NS 


Bewels. Das Integral in (4.84) ist fiir jedes feste z wegen w le") = 
a= 110) tp =o|5 konvergent und stellt offenbar eine iiberall analytische 


(ganze) transzendente Funktion von z dar.” 
Mithin ist 


@ 


(4. 87) F(z) = G(z)-4 | aa tak EF: 
T 
bis auf z--0, —1, — 2,... regular; man hat die Relation (vgl. (4. 84)) 
] u= 
(4. 88) zF(z)—F(z+1)= P + [u*e"],_, =0 (z+ 0, —1, —2,...)} 


und im Streifen 1 = (z)< 2 die (iibrigens grobe) Abschatzung 
fos) 1 @ 
(4. 89) |F(z)| S | u®@-le"due< | e"du- | ue-"du=—=1-+ _ 
0 ) | 


so dali die Anwendung des Satzes § 4, VI. 2 
(4. 90) F(z)=cI(z2) (c konstant) 


‘I Das ist das sog. Eulersche Integral zweiter Gattung. Man erhalt daher miihelos. 
eine Cauchysche Darstellung, welche fiir einen Streifen —»—1< 2(z)< —x (v= -0,1,2, uy 
gilt, oder fiir t(z) >0 das sog. Laplacesche Integral. 

72 Vel. z.B. Oscoon [32], S. 307. 
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ergibt. Beachtet man noch, daf 


f(b) ee | edi == 1, 
0 


also c= 1 sein mul, so folgt 


(4.91) F()=G@)+|uste"du (¢+0,—1,—2,..)). 


Daher ist die Giiltigkeit von (4.84), (4.85), (4.86) wegen g(z)= 
—/(z)—G(z) und durch (4.67) bzw. (4.68) sofort ablesbar. 
Es sei vor allem bemerkt, dafi die Transformationen u—-—logv und 
ue’ (4.85) in die gleichfalls iiblichen Darstellungen 
1 


(4.92) roQ= | (tog 1 as | 

Bw. : : | (9t(2) > 0) 
(4.93) r= |er'de 

iibertragen.” i 


Ist x eine beliebig angegebene komplexe Zahl mit 3t(«) > O und schreibt 
man in (4.85) u=<t, so folgt © 


(4.94) T@=x | tte“dt  (R@)>0), 


1 : 
ertstreckt iiber die Gerade argt—arg ~~; mit Hilfe des Cauchyschen Inte- 


gralsatzes zeigt man leicht, daf der Integrationsweg wieder die positiv-reelle 


Achse sein kann. 
Inbetreff (4.86) ergibt die Benutzung von (4. 68) und (4.81) 


| : vars J leu 0, +1,+2 
(4.95) (2)= DP ein —$ ae Wee dil ee Oe 1, tees) 
Schreiben wir zweckmabig 1——t im letzten Glied, so entsteht wegen 


uw eZ logu (log u = 0) 


73 Bei Euter und Lecenpre tritt iibrigens lediglich die Form (4.92) (fiir rationale z 
‘bzw. z > 0) auf. — Wir erwahnen einen Gedanken, der die Betrachtung dieses Integrals, 
als einer Verallgemeinerung der Fakultat, geniigend zu motivieren scheint: setzt man in (2. 39) 
1 of 
1 \F 
z—1 und n—1, so folgt die Darstellung (v—1)!= [ (toe (Ltlan (en Ly Dm) s 
Om 
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> _ c gat 1—e amis \ 4-1: 
z u —— pine 7 t dt= 
ute" du=e {Ve e dt- OST ris e 
4.96 : 
(4.96) , G 
=s | | fie chs has | fedt |; 
. & me - 


@ 


hiermit gilt fiir jedes pee Zz 


(4.97), £@)= ise 


i (a dat+r ‘eat + | ead], 
=F 7 


wobei die Integration in der Mitte auf den (im positiven Sinn durchlaufenen) 
EADEISKCELS sonst auf die negativ-reelle Achse zu beziehen, ferner (vgl. (4. 81)) 
fot — -Dloe! , (f= e® DORI 7 verstehen ist.” 
Nun erkennt man gleich, dafi es allgemein nebst R> 0, S <= 1 
l te ale lot ats C8) Peat Oe rear 
2isinzre } 


(2-K0, 41, £2...) 


besteht, wo 4.5 die beiden durch t= ue*'" (R=u=o) gekennzeichneten, 
gemafi wachsendem bzw. abnehmendem w zu durchlaufenden Halbgeraden, 
fr aber den Kreisbogen t= Re'"*® (—d = & = 0) bedeutet. 

In der Tat: 1. das erste und dritte Integral in (4.98) konvergiert fiir 
jedes in Betracht kommende R, 0 und z wegen 


(4,98)) (2) 


@ 
) é De +idne } idn 
(4. 99) (Ox) | f edt + e™ | weet dy 
: 5 
und zwar, wie die Abschatzung 
(4. 100) | ut 1 neon | == w2e)~1 eu cos dx o| =| 
iy 


zeigt, bei festgelegtem R und z fiir ; -«=|0|=1 (¢>0) gleichmafig; 2. der 
Integrand ist bis auf f =O iiberall eindeutig-regular, so da der Cauchysche 


Hauptsatz, ferner die nebst -< 0, < 0; 


IIA 


1, €&=R(z), 7 = X(z) und fiir alle 


aM. a. W.: denkt man die ¢-Ebene linge ¢< 0 aufgeschlitzt, so beziehen sich die 
geradlinigen Integrale auf das obere bzw. untere Ufer des Schnittes. 
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fo: <= oe'"* (9 >0, 0,<|4%|<94,) geltende Abschatzung 


oes" dart +6 


(4. 101) (f.) | fe'dt|—|oia eined+0e'"F 1G) <= rrernos cocoss, x7 


+id nt +6, 


ee 


die Unabhdngigkeit der Klammer in (4.98) von der Wahl der Parameter R 


und 0 liefert; 3. da Ox)! teat — (0) fiir festes R und z auf Grund von 
(4.100) an d=1 stetig sind, geht die rechte Seite von (4. 98) mit R= 1 und 
O— 1 in diejenige von (4.97) tiber. 

Es verdient eine andere Form von (4.98) zu bemerken, in welcher nur 
iiber reelle Wege erstreckte Integrale vorkommen: wegen (vgl. (4. 99)) 


ee) | teats (bo) | fo edt— 


@ 
= | uw -1 (era tne Ont — e-t6nz +ue du fet 
(4. 102) < 

@ 


== 2) | uz-1e" 08 On sin (Oarz+usinda)du 
vee . 

und (vgl. (4.75)) 

(4. 103) é 5 


| f''dt—R xi | einderke™ 9G 9 j-R’ | eX 879 cos(a9z-+ RsinwP)add- 


a) 0 


erhalt man fiir R>0, x <0 =1 und beliebiges z 
6 
P(z)sinaz=2R | eRcosm cos (ruz+Rsinwu)du+ 
0 


(4. 104) - a 

+ | ute" eos &* sin (Saz+u sin d)du, 

R 

‘woraus (4.86) sich speziell fiir R—0—1 ergibt. | 
; SchlieBlich sei erwahnt, daB (4.86), (4.97), (4.98), (4.104) mittels 
I(z) sin aZ= TG (vgl. (4.11)) zugleich in (fiir alle z giiltige) Infegral- 

—z 
darstellungen der reziproken Gammafunktion umgeschrieben werden konnen,. 
ferner, daB der (aus §-s, fr, $s zusammengesetzte) Integrationsweg in (4. 98). 
sich auf Grund des Cauchyschen Hauptsatzes und von (4. 101) durch einen 
beliebigen Weg & ersetzen abt, welcher 1° vom Punkte co ausgeht und bis. 


1 y ; 
75 Die letzte obere Schranke strebt bei festem z und io: < 6,<1 fiir oe — ~ offenbar 


gegen Null. 
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zu einem Punkt #~>0O in der unteren Halbebene verlauft, 2° dann durch die 
obere Halbebene wieder in den Punkt ce zuriickgeht und 3° indessen ganz 
innerhalb einer Kreisscheibe |t| =, gleichwie eines Winkelraums |arg t| = 
= da> bleibt. 

Mithin hat man die Darstellung (vgl. (4.98)) 


thd A ye beliebi 
(4. 105) TG) at i-e.0r (z g) 


76 


als eine Erweiterung des Hankelschen Schleifenintegrals fiir J "(aye 


(Eingegangen am 21. Dezember 1954.) 
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K TEOPHM FAMMA-®YHRUMN, ¢-bYHKUMM PHMAHA 
MW JPYTUX, POACTBEHHbIX UM ®YHKUMM. | 


M. Muxonaw (Byfanewr) 


(Pesto Mme) 


Beufy BaKHOCTH YHOMAHYTHIA (PyYHKUWM MOHATHO, 4YTO HX OOWMPHAA ANTepaTypa 
COMePHKUT HE TOABKO padoTHI, U3NaraOulMe BNOMKE HOBIE Pe3yAbTAaTbI, HO M TaKHe, KOTOPbIe 
JIMWUb C HOBOM TOUKH 3peHnaA TpakTyHOT KaccMyecKyIo TeopH1O. OrpakuyunKasich JMWb pac 
CMOTPeHHeM MTEpaTypbI NOCMeAHUNX AECATHAETUM, MOKHO yKasaTb NPExKAe BCerO Ha PaooTbI 
Anexceescxoro, Aptuua, Bepuca, Bennepcroro, Ppousaana, Ven- 
cena, Jlepxa, Menanua, puurcxeumMa, a tawxe na monorpadun [42], [26] 
[8], [39]. 

B ocnone HacTronmen padoThr exKaT HOBbIe pe3synbTaTH! paboTE [29] Oo ramma- 
(pyHKQuH HO Apyrux posCcTBeHHBIX eH (byHkunAx. ABTOpy yfanoch janbule pasBHTb 3TH 
pesyibTaTbI B Pa3HbIX HaMpaBeHHAX HM BCTABHTb UX B CKATOe HOBOE NOCTpOenne BCeiP 


Teopnn. 
n-1 


es tai, ‘e 
McxOfHbIM NYHKTOM CYHKUT UCCACAOBAHHE PALMOHAAbHON (PPyHKUNH 2, (Z, 2) = ay (z-+-k)! 


k=0 
npn 2K00M UeIOM noKasaTene p—OOoOujaroueh CyMMy cTeneHen 1” -- 2? 4 --- 4 n® 
(§ 2). Nocne storo 8 §3 nccnepyorca Mepomopuasn (bynKunsa ¥(z)— lim [log n—2_, (z, n)} 
nu—-> © 
u npouspogupre ~! (z)— (—1)” (v—1)! lim 2 »2, as § 4 chynkuna log F(z)= 
nu—-> © 
 (f) dt w ramma-(pynkunsa 
i 
2 | fp 1, vA nin? 
E(Z) = XP (0) Ota iment ees lim ———~— : 
@) P () n> 0 n> © z(z+ 1)--- (+n) 


1 


Kaokgad rapa HaunHaeTCA C COOTBETCTBYIOMIMM PaSHOCTHBIM ypaBHeHNeM NM BbITeKAIOUWMME 
us Hero ApyrumMn (byHKUHOKaTbHbIMM ypaBReHHsmu. Tocne aroro Caep~yioT pasanunpie pas- 
JOKEHHA B PAL, MATerpadbHble Npewcrapuenus, Npocredimue TeopemMbl OxapakTepusoBanus 
u acumnroTnyeckne pasioKenns. B § 1 nerko nonyyaemast nponssopzamaa dynKuna (1. 1) 
yenaeT yoOnbIM BBe_eHHe NOMMHOMOB Beprysm &B KAYeCTRE BCHOMOFATeAbHBIX (byHKuHM Ha 
ocHose (1.2); Tora umeem 8,,(z,n) =p! [B,44(2 + ny—B,.4 (z)] (p =0, 1,2, ...), mu onHoB- 
peMeHHO jerkO mosyuaem CooTHOWeHHA fA B,(z), u chopmyny cyMMupoBanua Dinepa— 
Maknopena, KOTOpad HaM 4YaCTO MOHA_OGNTCH B WanbHeHuIeM (B OCOGeHHOCTH B CBA38H C 
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AaCHMNTOTHYECKHUMH MHATerpasbHbIMu npeACTaBseCHusAMn), Murerpanpupie (popmyapr (1 
YHOMAHYTHIX HELIX (pyHkunii BBIBOAATCA HENOCHeACTBeEHHO U3 COOTBETCTBYIOWLErO onpeje— 
-l€HUA CYMMbI, HA OCHOBE TOKAeCTB 


1 


ate | yet} du (it (z) = 0) 


o 
1 
1 i n > 


Z+k ~~ sinaz J cos (z+) audu (24-0, 31, 42..:)5 


0 


TaKMM OOpasoMm AAA KaxKAON uB 9THX (POpMya NomyyaioTcs jABA npefcrapyenusi ,B KOHeYHOM 
Buse“, OAHO U8 KOTOPbIX CcnpaBeqHBO B nonynrockoctn R(z) >0, a ppyroe pasa Bcex 
HCUCAbIX SHayeHUM Z. (Kak HBBeCTHO, BCe HHTerpanbupie npeACTaBnenua KAaccnyecKoll Teopun 
— 3a MCKOYeHHEM OfHOrO, T.H. HHTerpana Tankena — cnpaseqausbt TOnBKO B OHOK 
NOAYNAOCKOCTH.) 

M3 mpeumyujects yKasaHHOrO MeTOJa U3NO%KEHUA MOKHO OTMeYATE cnemyroume : 
1. Bee scrpeyarouineca npegctapnenna B Bue pALa uu NpOnsBesAeHuVA MODKHO CHaOMaTh 
OCTATOYHBIM YJICHOM ; HCKOTOPbIM KaaCcC noOAyYaeMbIX TAKUM OOpasoM Mmpe_ctrapnennit — 
PasAOKEHHA B YaCTHYHIE APOOM — mMepexosnT B Mpocreimem cayyae B KAACCHYeCKHe 
HHTerpabHBIe (hopMyabl (Oiaepa, Jlexanppa, u 7. J.), ABIIICh TAKUM OOpasom OGOOMLeEHHEM 
9THX NocaepHMxX. 2. AcumnroTuyeckue pasnoxennst (B ux 4NCHe H (popmyaa Crupaunra)- 
MOAY4AIOTCA HETPYAHHIM BHIYMCIEHHEM U3 COOTRETCTBYIOMIUX (hopmys AA cbyHKuMi 3_, (z, n), 
STH KE (POPMYbI MOKHO HEMOCPeACTBEHHO sanncath, CreayA Diepy—Maxaopeny. 3. B coor- 
BCTCTBUM CO CKa3aHHbIM NOMyYaeTCs PA, HOBHIX MHTerpasbHbIX NPeACTABACHHE JAA BeULeECT- 
BCHHBIX TyTeM “HTerpupoBaHuA (C TpuroHOMeTpu4ecKkumu cbyHKuuAMH B uATernanye); aTH 
npeactapienua — B OTAMYMe OT MBBECTHHIX AO CHX NOP — ocTawTCA B CHae AIA BCE; 
nockoctu Z. 4. YNOMANyTHIeE MHTerpanbt MpOcTHiMn npeoOpasoRanuamn nepeBrogatTca RB 
KOMIMICKCHBI€ KPUBOAMHEMHBIE MHTerpatbl 10 8aMKHYTHIM HIM H@SAaMKHYTHIM KOHTYpaM, TaK 
4TO CTAHOBMTCA M3IMWHUM TIpHMeHeHNe OTHOCHeNCH cloga ufen Pumana us Teopne 
tpynkunn, 5. Beerfa merkO yCTaHOBuTb, KakOe MMeHHO 3HayeHHe (GecKOHeYHOsHa4HOrO): 
KOMIMIeKCHOrO AOrapudpMa uM Kakyto BeTBb (pyHKuun Log J’(z) cnea~yer B3ATb, Mey TEM 
Kak B CyulecTByrouleH AO Cux NOP AMTepaType aTOT BONpoc yacTO He NOayyan ypoBaneT- 
BOPUTeAbHOe OCBEMeHHe, YTO HHOT Aa AaxKe NPUBOAMA K HeAOpasymeHnaM. 6. BaodazoK yso6nO 
nonyyarwrcn: pasnoxKeHue KOTAHreHCa WM CuHyca Ha npocrenume pApobu nu B OecKdHEYHOe: 


mponspefsenne COOTBETCTBEHHO (C OCTATOYHDIMH. 4YeCHAMH); BbIPAKeHNA B KOHEYHOM Bue 
@ 


gs / 
(c MOMOMIbIO YNCen u MOAMHOMOB Bepxyaan) aa cymm psagos £(v) a. rc (Gi) ean) 
i A=i “ 


npuvaqmexaune Duaepy u COnuHy; HOROe npescraprenne Asi KOHCTAHTHI y Jusaepa— 
Mackepouu; HOBOe, OYeHb NHpocroe MOKasaTeABCTBO AAA T. H. TPHrOHOMeTpHYecKOrO pas- 
noKenusa Jlepxa u BMectTe C TeM fla paya Kymmepa, nu T. @. 

dlLog f(z) 2 IT" (2) 


Tak, Hanpumep, Aaa #(z)— oh Te noAyYMM npegcrapnenua (1.3), re 
sHayenne Q(z) TO xe, 4uro uv B (1.4). (Cm. §3, VIL) — Jaa snayennn ¢-spynkunn 
ie ; 
= We z ¥ meme (1-3) 
Typsuua ¢(» 4-1, z+1) = ———~_, OT CHR BbITEKAeT (1.5). Camo coorHomenne (1. 
eae Ae 0™ 


nepexogquT ana n=O B bopmyny JIexangpa (1.6) umm CcooTBeTCTBeHHO B HOROE npeacras~ 
neue (1.7), Mex~y Tem KaK AIA N—» co us Hero NOMyYaeTCA pasiOKeHNe wa NpocTeummMe 
apo6u dbynkuuu #(z). M3 cneacrsuii (1.6) u (1.7) cnenyer ykasatb Ha dd. 9), (i, 10) w (1. 11). 
(1.7) nerko npeoOpasyerca B KOMMIeKCHBIT KOHTYPHbIM MHTerpan: B (2. 12) cne~yeT B3cTb 
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3a KOHTYP HHTerpupoBaHHs CAMHNYHYIO OKPyxHOCTb ¢ e" (—1<u=1), onncannyw B 
NOAOKUTEADHOM HanpapseHin, 

JIpyrum npumepom cayxut npeacrapaenne (1.13), rae g(2) OsHayaeT Uenyto PyHKUMO 
oo : 
ule" du,a q,(2)—onun ua uurerpanos (1.14). Toroxns sgech n=—0, noayaum 
0 
ouaepospit muirerpaa (1.15) man coorsercrBeHHO HOBYyIO WHTerpadbHyro (popmMyay (1. 16); 
ecCan 0%Ke N—> oo, TO NOAyYaetcH T.H. pasmoxenue [Ippim’a /°(Z) Ha npocrerimne Apoodn. 
Us (1.16) yaa te" nenocpencrnenuo Rprrecaer (1. 18), rae nyTH uATerpupoRanna cyTb: 
Jit Cpesnero uneHa eANHHYHAS OKPYKHOCTA (OT —1 oO -—-1 B NOAOKUNTeEADHOM Hanpak- 
A€HMN), a AIS NepBoro Hu TpeTberO 4NeHa BeEPXHNM HW HIDKHUM Kpal COOTBETCTBEHHO Ce4eHUA 
BqO1b f=. O pumaHoson nOBepxHOocTH js TOrapucpma. []pumensast OCHOBHy!IO Teopemy Kouin, 
renepb yoke HeETpyAHO NOnyuNTH npeAcrapsenne (1.20), rae nyTb unTerpupoBaHusa Y—npo- 
HBRONbHAaH ,,neTAA“, HAXOMMHAAICT OT oo 10 TOUKH © > O B HWDKHEI MOMyNAOCKOCTH NMAOCKOCTH 
t, a OTCWOAA OOPATHO K CO B BEPXHeH NOAyNAOCKOCTH, OCTaABasIcb NpPH 9TOM B HEKOTOPOI 


Uv 
oonactu |t|< oe, jargt| > é6a> og (e, 0O—nocrosHHpie). (1.20) apasiercs OOOOMeEHHEM T. H. 


UHTerpanbHon (popmyabr TanKkess. 

Ms ppyrux HOBbIX pesybTaTOR OTMETHM eule Npescrapsenne (1.21) cnpaseanuBoe pA 
O<z< 1 (§4, Vil), a tawKe Teopembl OxapakTepn3zoBannsa us §3, VI. 2, noKasaHHbe C 
nomoubw Teopem JInysuaaa un Mutrar-Jle@idbaepa. Mo arum reopemam cpynkuna 
F(z) u aroOat us ee MponsBOAHbIX XapaKTepusywTes COOTBETCTBYHOLUMM © PaSHOCTHHIM 
YPaBHeHNeM, AONOAHCHHBIM YCAOBNEM peryasIpHOCTH mM OrpaHHyeHHOCTH Aad HeKOTOpOrO 
no0ca. 


ON APPROXIMATELY DIFFERENTIABLE FUNCTIONS 
OF TWO VARIABLES 
By 
LASZLO GEHER (Miskolc) 
(Presented by G. Atexirs) 


A. KHINTCHINE [1]' proved the following theorem: In order that a 
finite measurable function f(x) defined on a measurable set” MCR, may 
be approximately derivable at almost all the points of this set, it is necessary 
and sufficient that the set M shall be representable as union of a set of 
measure zero and of a finite or enumerable monotone ascending sequence of 
measurable sets on which the function f(x) is absolutely continuous. 

This paper deals with the following generalization of the above- 
mentioned theorem of KHINTCHINE, concerning functions of two variables: 

THeorem. /n order that a finite measurable function F(x, y) defined or 
a measurable set MCR, may be approximately differentiable at almost all the 
points of M, it is necessary and sufficient that the set M shall be represent- 
able as union of a set of measure zero and of a finite or enumerable 
sequence of measurable (closed) sets on which the function F(x, y) fulfils the 
Lipschitz condition. 

The proof of our Theorem is based on four lemmas. 

Lemma 1. Jf the finite measurable function of two variables F(x, y) 
defined on a set McR, is approximately differentiable at almost all the 
points of this set, then the set M is representable as union of a set of 
measure zero and of a finite or enumerable sequence of measurable (closed) 
sels on which the function F(x, y) fulfils the Lipschitz condition. 

Proor. In accordance with the theorem of LusIN we may suppose that 
the set M is closed and F(x, y) is continuous on M. We denote by A,, the 
set of the points (x,y) of M which fulfil the following condition for every 
two dimensional interval Q:° 


ge [| FE MFO | ens & em Soe 
is aval V8) + (yay Beals na] Bre) 


whenever! 0(Q)= ea and (x,y) © Q. 


\ 


1 See Bibliography. 

2 R, denotes the n-dimensional Euclidean space. 
3 ~ denotes the n-dimensional Lebesgue measure. 
4 6(Q) denotes the diameter of Q. 
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As the function F(x, y) is approximately differentiable at almost. all the 
points of M and from the density theorem it follows 


L,f U A,| = La(M). 
n==1 ) 
Let A“ be the intersection of the set A, and of the closed square 
i, ttl ok k+1 
aun [t t,t 


fet ee 
Let (11,91) € AG? and (x, 9) € AN”, then putting Q—[x,,%25 1, Jal 
the sets 


(i, k=0,-+1, +2,...). 


and 


g [| FE DrPH) | <n: sy emng| 
én LIV (E—xny + (4—y,)" | 
E j ed ee m)—F Os, Js) <= n; (&, 7) e Mn Q| 
én) LI (E—x0)? + (7—2)” 
have according to (1) a point (x,,y,) in common whenever x,=-x. and 
Ji == Yo. Hence 
| F (x1, 1) —F X25 Y2)| = |FCG, n)—F (Xs, ¥s)| + | Fs, Ys) — FX, 2)| S 


= n(\/ (x.— x3) + (n—I2) + 2) + O—7,)’) = 20 Vx — x)? + 2) 
it X, === X5 OF Ve Va ale lee 


: bs d 
Q- Sf ly net 5 OW) IIe 


or 


Q 


1 
X1, X03 Vas Wi + 9 (ox), 


respectively. 
The set M is closed and the function F(x, y) is continuous on M, 


consequently F(x, y) fulfils the Lipschitz condition on the closure AG” <M 
of Av”. We see at once from the construction that 


L.{ U Lio Ag”). L.(M) 
n=l] i=-© k=-@ . 


and this completes the proof. 


LEMMA 2. Let F(x,y) be a finite measurable function defined on a 
measurable set MC R,. If the set M is representable as union of a set of 
measure zero and of a finite or enumerable sequence of measurable sets on 
which the function F(x, y) fulfils the Lipschitz condition, then there exist the 
finile approximate partial derivatives Fy,(x, y) and Fup, (x,y) at almost all 
the points of this set. 
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PRrooF. It is sufficient to prove that if the function F(x, y) fulfils the 
} Lipschitz condition on a measurable plane set L, then the approximate partial 
derivatives Fy, (x,y) and F,,,(x, y) exist at almost all the points of L. Let us 
now denote for any number 7 by Ll the linear set of the points x such 
that (x, 7)¢€L. The linear set Ll"l is measurable for almost every 7. Hence 
for almost all 7 the function F(x, 7), as function of x, is approximately 
derivable with respect to x at almost all the points of Ll’. Since further, the 
Set of the points of L at which the function F(x, y) is approximately partially 
derivable with respect to one variable is measurable, it follows at once that 
the function F(x, y) is approximately partially derivable with respect to x at 
almost all the points of L. Similarly, we establish the corresponding result 
concerning approximate partial derivability of F(x, y) with respect to y. 


LEMMA 3. /f the finite measurable function of two variables F(x, y), 
defined on a measurable set MCR,, is approximately partially derivable at 
almost all the points of this set, then M is representable as union of a set of 
measure zero and of a finite or enumerable sequence of measurable (closed) 
sets on which the function F(x, y) fulfils the Lipschitz condition. 


PRoor. We may clearly assume that M is bounded. We may further- 
more assume, in accordance with the theorem of LusiNn, that M is closed, 
further F(x, y), Fay,(%, 9), For, (% y) exist and are continuous on M. 

Suppose that 


| Fav, (% Y)| + |For, (x; )|--1<k for (x,y) €M. 
We denote by B, the set of the points (x, y) of M for which 


@ 1(e[|FEX=FEY |< Ke nema=szell= 3-0 


S 
‘ 1 9 
whenever 6—e@ = 7 and x € fa, 6]. 


Each set B, is closed. To see this, put (x;,¥.)€B, and lim Coe) 


= (xX), ¥)- Then, the set M being closed, (%,%)¢M. Let a= es = * and 
put a, = e+ xXi—Xo, Px = Pot X:—Xy SO that we have a, = xX, = &, Br—e@e = 


3 
= h—% = a and according to (2) L,(Z,) = 4 (G,.— ax) (k= 1, 2,...) for 


atts Vn) — F(X, Ve) = 2K: (&, yr) € M; a), = 
5— Xi 


(2001, ot): 


As the sets E, are closed and, in consequence of the aie of F(x, yy 


— =& == Dy 


ie = E| 


on M, E,>lim Sup E,, we have L,(E)) = lim Sup Lit 5 (=e) so that 
finally (Xo, Yo) € Ee 
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As the approximate partial derivatives exist everywhere (at the points 
of M) and almost all points of M are points of density in the direction of 
the x axis, it follows 

L.(m— U Bul 30s 


; : tie. : 
Let us divide the plane with the straight lines x— - into stripes parallel 


to the y axis, we denote by B,,,, (m=-0, — 1, ~-2,...) the intersection of the 
ae : 
set B, and of the stripe ; =x Le . On the set B,,,,,, the function F(x, y) 


fulfils the Lipschitz condition in the direction of the x axis. 
Namely, let (x,y) € Bum and (x, y)€B,,,,; the sets 


| < wy | 
g||FE—FCLM) = x; © )€MsE baal 


et 


and 


Ske ye M; 5€ 1%, %) 


E—x, 


E| FE yy— FCs, y)| 
é'L| 


have then by (2) a point x, in common. For the points xX; we have 
|F(x1, Y)— F(x, y)| = |Fa, y)—F (xs, y)| +1 F (xs, y) —F(m, y)| S 
= K(|x:—x,| +|x.—x3|) = K|x,—xa|. 
Let us resolve the analogue construction in the direction of the other 
axis, i.e. let Bi), be the set of the points (x,y) of B,.,, for which 


ppt FA DY). EKO HES as C=] 7 Se 


n—y ‘ 


L(e 


= 2-9) 
] 
whenever S—a = j and ye [«,P]. Let us divide the plane with straight 


: k 
lites <)== F (kK=-0, 1, +-2,...) into stripes parallel to the x axis and 


denote by Bi’) the intersection of the set B”,, and of the stripe | 


Ia ss — k-+1 
i ey 
Let’ (x1;-4) © Bun and (xq, y,)€ Be Then according to (3) the closed 
sets 
F(x 7) —F Oy sys) ee 
je | ( ) =) ( J ) | = kK ; (, ) € Be my yf € Ly, ’ va 
and , 


E| F(X, i)—F(X, yo) | 
Wi | HN—)2 
have a point y, incommon. 


Wy gts (x), 7)€B,, one Dir| 
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Accordingly 


FX, Yy)— FX, Yo) | S| FO, Wi) — FO, Va) HFCs Ys) — FO, Vs)| > 
+-|F (x2, Ys) —F(%, »)| S K(\y.—s| +21 — | +|s—2!) = 
= 2K\(x%.—m) +(n—y,)’. 
The set M is closed and the function F(x, y) is continuous on M, conse- 


quently F(x, y) fulfils the Lipschitz condition on the closure BY" <M of 
Bi". We see at once from the construction that 


LIU U UU Bryn |=L.(M) 


and this completes the proof. 


LemMMA 4. Under the hypotheses of Lemma 2 it follows that F(x, y) is 
approximately differentiable at almost all the points of M. 


Proor. This follows at once from the extension theorem of functions 
fulfilling the Lipschitz condition [2] and from the theorem of RADEMACHER [3]. 

Now we are able to prove the Theorem stated at the beginning of the 
paper. We shall prove it in two ways: 

1° It follows from Lemmas 1 and 2 and from the theorem of 
STEPANOFF [4]. 

2° It follows from Lemmas 1 and 4 (without using the theorem of 
STEPANOFF). 

CoroLtary (Theorem of STEPANOFF). /n order that a finite function 
F(x, y) which is measurable on a measurable plane set M may be approxi- 
mately differentiable at almost all the points of M, it is necessary and 
sufficient that F(x, y) shall be almost everywhere in M approximately partially 
derivable with respect to each variable. 

When this is the case, the approximate partial derivatives Fiy,(x,y) and 
Fup, (x,y) are at almost all the points (x,y) of M the coefficients of the 
approximate differential of F(x, y). 


Proor. Necessity. From Lemmas 1 and 2. 


Sufficiency. From Lemmas 3 and 4. 


(Received 8 February 1955) 
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OB ANMPOKCUMATUBHOM AU@bEPEHUMPYEMOCTH @YHKUMU 
JIBYX MEPEMEHHbIX 


JI. Pexep (Mumkozsu) 


(P e310 Me) 


B nacrosmei padore faetcs OOOOuIeHHe Ha (pyHKUMIT MHOrMX NepeMeHHbIX TeEOpeMpI 
Xuwunna [1]. Umenno cnpapeznupa crepyronas 

Teopema. Koneunaa usmepumas (pyHKUNa AByX TepeMeHHbIX F(x, y), ONpeqenennast 
Ha H3MeEpHMOM MHODKeECTRE M, sibadeTCA aNNpOKCUMATHBHO AudpeperuNpyeMOl MOUTH BCIOAY 
Ha M, torga un TonbKO Torga, ecau M pasioxKHMO Ha CYMMY MHO*KECTRA MePbI HYJIb H 
KOHEYHOPO WIM C4eTHOTO YNCIa H3MEPUMBIX MHOXKECTB, HA KAKLOM U3 KOTOpBIX F(x, y) 
yAosnersopxet ycarormio JInnuniya. (AsmMepumple. MHOOKECTBA MO>KHO CUUTATb H 3AMKHYTHIMH.) 

M3 nemMM HactTosulel paGoTb! BbITeKAeT Kak CeACTRUE HOBOE AOKAZaTeABCTBO Cae;py- 
rule Teopemst Crenanora: 

Koneunas usmepumasi (pynkunsa F(x, y), OnpesenenHast Ha HsMepUMOM MHOKeCTRe M, 
anMpOKCHMATHBHO jnqupepenuupyema nourn BcroAy Ha M tora u TOAbKO TOrWa, eCAn NOUTH 
Bciony Ha M CyulectayloT anMpOKCHMAaTHBHBIE YaCTHBIe NpoUsBOAHbIe Foy,.(x, y) 1 Fap, (x, y). 

Torga nourm sewny wa M Fwy, (x,y) mu Fop, (X,Y) apamtores Koadppunwertamn 
anupoxcumatTuBHoro judpepenunana F(x, y). 


~ A SPECIAL SYMMETRIC EQUATION IN A FINITE FIELD 
By 
L. CARLITZ (Durham, USA) 
(Presented by L. Répe) 


§ 1. Introduction 


MORDELL [2] has discussed the congruence 
(1. 1) a,0,+---+a,0,=a (mod p), 
where o, is the r-th elementary symmetric function of Xj, +--+, %,; he ‘provec 
that the number of solutions of (1.1) is equal to 


(1. 2) Po+O(p?) | (p+), 
except in certain excluded cases. In the present note we consider the spe- 
cial case 
(1. 3) 0;=a (mod p) 
and determine explicitly the number of solutions of (1.3). Since it is no 
more difficult we take a,x,.€GF(q), where gp" and p is an arbitrary 
prime; in particular the case p==2 is not excluded. For the final results, 
see Theorems 1 and 2 below. 

It may be remarked that the equation 
(1. 4) U Kater poater = 07% oye O (a, 0,0,Q, == 0) 
is really no more general than (1.3) as is clear on making the substitution 
m=—0,), (f= 1,2..,4).in (1.4). 


§ 2. The case gq odd 


Let M= M(a) denote the number of solutions of o,—a. Also put 
2. 1) A == N{X,X_ + XoXs + XyXr OF, 
(2. 2) B(a) = N{X, Xo + XoXy + XyX =O, XXX, =}, 
where the symbol N{---} denotes the number of solutions of the indicated 
system. It is clear that 
2.3) M(a)— A+ qB(a). 
We shall first consider the case a=-0. Then clearly B(a) is equal to 
the number of solutions of the system 
(2. 4) xixX5 + a(x, + %) = 0 (Ge bei 10)e 
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If we define Y(a)— +1, —1, O according as @ is a square, a non-square: 
or 0 of GF(q), then it is seen that 


(2.5) B(a)- > {1 + B(ae—Aax)}. 
If we put 
(2. 6) J@)=2> P@—4x) (J(0) 0), 
then (2.5) becomes 
(enh) B(a) = q—2-+ (a) /(a). 

In the next place returning to (2.1), it is easy to show that 
(2. 8) A=q'—q. 
Hence, by (2.3) and (2.7), we get 
(2. 9) M(a) == g’—2q +9 (a) J (a). 

We next evaluate /(@). In the first place it is clear from (2.6) that 
(2. 10) J(ab’) = (6) J (a) (6 =- 0), 
which implies 
(2.01) F(ab)» =J*(@ (b=- 0). 
It is also evident that 
(Zae) J(ay=0 (34q—1}), 


so that we may now assume that g==1 (mod 3). 
Now consider the sum 


S= >, J*(a) 2 >» B((a—4x) (a—4y’)). 
In view of the known ee 
(2. 13) pa Hi(a’—d) = —1 (d+: 0), 
we get 
S= 2 (-I)+ 2 @—-1)=—-@—39+2)+@—-1 01 +3@—)), 
which rears to = 
(2. 14) S=2q(q—1). 


In the next place if w denotes a number of GF(q) such that w?+w+1—0, 
then it is clear from (2.11) that 


S=3 O-D)(FO+ PW +LW)}. 
Hence (2.14) yields 


(2. 15) P+?) +7") = 69. 
By (2.6) we have also (since “(w)— 1) 


(2. 15Y J(1)-+ Jw) + Jr) 03 


H 
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thus (2.25) becomes 


(2. 16) FO) as QW) se JW) = 39: 
‘We also note that (2.)6) implies 
oe. iT) . JQ)=/W)=!1 (mod 3); 
“moreover 
fa 
: i atk oy coat) 
Heu> Ce ays 
r I Cea 7 
Be 
and consequently when p=—1 (mod 3) 
] Ww 
2.18) JQj=— ; (mod p). 
3 (p—}) 


The last step is a consequence of the familiar congruence 
Ugo Gi Paes a, PT). (°° tj i 
bo wD ee Pak ats b,.p” ae by b, c b 


Pr = 04; p—!. 
When p=—2 (mod 3), J can be explicitly evaluated. Indeed we have 


(mod p) 


JOP) = Jw) = > Bw — 42") = > B(w—4x') = J), 


1 
so that (2.15) and (2.16) imply /°(w)—4, I@w)=2 q”. Hence, using (2. 17), 
‘we get 
1 1 
(2. 19) JOQ)=—2Jm), JM=(-1) # (p=2 (mod 3)). 
We have now evaluated /(a) in all cases and hence determined M(a) 


for a=+0. (For a detailed discussion of Jacobsthal sums see WHITEMAN [3].) 
To determine M(O) we note that 


M0)=9— 2 M(a)=q'——1) @—29)—-9 = Pa) J (a). 
Now by (2. 13) 
SG@J/@=— D> > V(@—4ar) =, 


and therefore 

(2. 20) M(0) == q°+ 2¢°—2q. 

It is not difficult to give a direct proof of (2. 20). 
We may now state 
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THEOREM 1 (g odd). The number of solutions of 0,—a ts determined 
by (2.20) when a=0 and by (2.9), (2.12), (2.18) and (2.19) when a==0. 


In particular 
HAGY, gq’ ge (a +-0, g ==1 (mod 3)), 


M(a)—q oy ee ‘tg? (a=-0,qg==1, p=2 (mod 3)), 
where t-=—2 or 1 according as a is or is not a cube of GF(q). 
§ 3. The case g even 


We again use the notation (2.1), (2.2). Then both (2.3) and (2.4) 
hold. Now define /(a)==-}-1 or —1 according as the polynomial w°+-u+-@ 
is reducible or irreducible in GF [u, qg]. It follows that 


(S41) I(a + 6) = l(a) l(b). 
We now put j 
(3. 2) L(@)= > I(ax), 
so that in particular 
G3) L(a)=L(@’)=L & (a+ 0) 
and 
(3. 4) Lia)=—L(a) (6 =- 0). 
It is convenient to define the function 
(—] *(a==0), 

(3. 5) fe( Gt) = 

Oe jee (a—0). 
It follows from the definition of /(a) that 
(3. 6) Dy =, !(ax)= - k(a). 


In the next place, ang a, 1) and (3.6), we get 
> Pa)= > lac +y¥))=> Aker y= 

(3. 7) a0 

(QS) ogee —2(9—1)—{(g—1" —3(g—1) —2q(q—}). 
Now clearly 
(3.8) L@)=0 (34g—1), 
so that we may assume g=1 (mod 3). If then w*+-w-+1—0, w€ GF(q),. 
we get, using (3.4) and (3.7), 
(3. 9) L*(1) + L?(w) + L?(w*) = 6¢. 
But we have also 


(3. 10) L()+L(w)-+L (wv) =0 


A SPECIAL SYMMETRIC EQUATION IN A FINITE FIELD 449. 
and by (3.3), L(w)—L(w") so that (3.9) reduces to 


(3.11) E(w)y=¢, L(w)- re 


To remove the ambiguity we note that (3. 2) implies Ll y=— (0) ==1 (mod 3), 
so that L(w)—1 (mod 3); consequently (3.11) yields 


] 1 
(3. 12) L(w) = (—1)?"q?. 
Returning to (2.1) we apply some results of [1], § 9 to get A; we 
find that 
a3. 13) A=g'—q’. 
As for B(a) examination of (2.4) yields 


— 


(3. 14) B@— > 1+1{~]|=9—2+2@)  (@+0). 


by aie 


Hence by (2. 3) 
3.15) M(a)=q'—2q + qL(a) (a0). 
As for a=-0, we have 


M(0) = q'— > (g'—29+ gL (a)) = 4 (q—1) (g?—2q) g > L(a); 


using (3.4) and (3.10) this reduces to 
(3. 16) M(0) = q' + 2q¢?—2q. 
We now state 


THEOREM 2 (g==2"). The number of solutions of 6; a is determined 
by (3.16) when a=0. When a-0 we have 


3.17) - M(a)=q'—2q (n odd), 

1 1 . 
(3. 18) M(a)= q?—2q + (—1)? “tq? (n even), 
where t=-—2 or 1 according as a is or is not a cube of GF(q). 


DUKE UNIVERSITY, 
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OHO OCOBEHHOE CMMMETPVHYECKOE YPABHEHHE B KOHEYHOM TIOJIE 
JI. Kapanuy (Maprem, CLA) 


(Pest Me) 


Ilycth o, (7-1, ..., 4) oanauaeT CUMMETPHYECKOM MHOFOWTEH CremeHH £ OT X1, «+ +5 X4- 
Mopaeaa [2] qoKasaa, 4TO 4NCAO pewieHuil CpaBHeHHs 
M0,+ °°: 4+ a4%=—a (mod p), 
HeECMOTPsS! Ha HeEKOTOPbie HCKJIFOYCHHS, paBHO 


a 


p+ olp:) aia pax. 

B nacrosue paGore onpemenseTca 97@MeHTaPHbIM NyTeM TOMHOE yncno M(a) pe- 
WICHHIT ypabueHitsl 7, a B m1000M KOHeYHOM Mone GF(q); (ormeyaetcaA, 4TO GOTee oousee 
ypapHeHue 

A, XoXgXq + +++ 4 4XyXoXg— a (@, As A304 = 0) 
¢ NOMOUbIO MOACTAHOBKON x, —a,y, (r= 1, ...,4) AerKO CBOANTCH K ypaBHeHHtO os — a). 
Vmeer mecto COOTHOWeHHEe 
M(0)— 9° + 2¢?—29. 
B cnyyae a- 0 sHayenne M(a) 3sapncutT OT YeTHOCTH HAH HedeTHOCTH yncia g, UW BO BTO- 
pom cayyae TakxKe OT TOTO, B KAKOM KMaCCe BbINeTOR mod 3 Haxogsitest uncao g HM xapaKTe- 
puctuka ot GF(q), HO BCerfa HMeeM 


3 


M(a)= q@ +- olq) nia 22.0. 


SUR LES FONCTIONS LOCALEMENT MONOTONES 
AU SENS GENERALISE 


Par 
AKOS CSASZAR (Budapest) 
(Présenté par G. Avexirs) 


1. Dans un récent ouvrage [1], j’ai introduit une notion de fonction 
localement croissante ou décroissante au sens généralisé, cette généralisation 
consistant a négliger les ensembles qui appartiennent a une famille % d’en- 
sembles donnée et soumise 4 quelques conditions générales. Dans la note 
présente, je vais examiner les propriétés des fonctions qui sont localement 
monotones au sens généralisé en question, et cela en tous les points d’un 
ensemble donné. Les résultats principaux qui vont étre acquis nous montrent 
qu’une fonction de ce type appartient au plus a la deuxiéme classe de Baire, 
qu’elle coincide, excepté les points d’un ensemble de mesure aussi petite 
que l’on veut, avec une fonction monotone par segments, enfin qu’elle est 
continue, excepté les points d’un ensemble dénombrable, lorsqu’on néglige les 
ensembles appartenant a la famille ‘.' 


2. Pour donner aux propositions précédentes une formulation précise, 
convenons des notations suivantes. 

Soit 9t une famille héréditaire et o-additive d’ensembles linéaires, c’est- 
a-dire une famille de sous-ensembles de la droite R satisfaisant aux condi- 


tions suivantes: 
Qi) SrAen et Sin ete ON ay 7D OO. 


(ay Si Are Nt (i—1}, 2, <.), on a = AEN. 


Comme famille ‘, on peut choisir par exemple celle des ensembles 
dénombrables, de mesure nulle, de premiére catégorie, ou celle des sous- 
ensembles d’un ensemble donné (vide ou non), cic. Toutes les notions qui 
vont étre introduites dépendent du choix de la famille X, mais, pour simpli- 
fier les notations, nous n’indiquerons pas cette dépendance, ce qui ne causera 
aucune confusion, la famille 9{ étant fixée une fois pour toutes. 
Nous désignerons par %t la famille composée des ensembles de la forme 
N+D, ot NEN et D est dénombrale. Cette famille satisfait évidemment a 


deux conditions analogues a (2. Lyaetateec). 


1 Qu’il me soit permis d’exprimer ma reconnaissance a M. G. Atexits qui m’a pose 
une partie des questions résolues dans cette note. 
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Soit f(x) une fonction réelle et finie, définie pour x€R. 0>0 tant 
donné, nous dirons que f(x) jouit de la propriété C.(0) au point x), SI 


(27-3) E fO)—IO) = 0, O< x—XH< | EN, 


AG —— OG 


et qu’elle jouit de la propiete C*(0) au méme point, si 


SO)=FO%) <0, 0<x—y= 6| EN. 
aay 


é 


En remplacant en (2. 3) le signe = par = et par >, on arrive a la définition 
de la propriété D.(0) et D¥(0) respectivement. Nous définissons les propriétés. 
C_(0), C*(d), D_(0) et D*(0) en substituant dans les définitions précédentes. 
— 02 xX—x,— 0 alasiormule 0 tata O. 

Nous dirons que f(x) posséde la propriété C, au point x, si elle y 
posséde la propriété C,(0) pour au moins un nombre 0>0O (et alors pour 
tout nombre 0>O suffisamment petit, d’aprés (2. 1)). On définit de facon 
analogue les propriétés CLD Der eer 

En supprimant le signe + ou — d’une des notations preécédentes, on 
veut dire que f(x) posséde toutes les deux propriétés, celle marquee par le 
signe + et celle marquée par le signe —. Par exemple f(x) jouit au point 
x, de la propriété C, si elle y posséde les propriétés C, et C. en méme 
temps; cela veut dire que f(x) est localement croissante au sens strict au 
point x,, en négligeant les ensembles Yi. De fagon analogue, les symboles 
C*, D et D* désignent que f(x) est respectivement localement croissante, dé- 
croissante au sens strict et décroissante, lorsqu’on néglige les ensembles Yt. 

Nous dirons que f(x) posséde au point x, la propriété M(0), si elle y 
posséde au moins l’une des propriétés C(d) et D(O). On deéfinit pareillement 
les propri¢tés M*(0), M et M*. Ces dernigres expriment que f(x) est locale- 
ment monotone, au sens strict ou au sens large respectivement, au point con- 
sidéré, en négligeant les ensembles %. 

Nous dirons enfin que f(x) jouit de la propriété E ou E au point x, 
si elle y posséde les propriétés C_ et D,, ou celles D- et C,, selon le cas, 
c’est-a-dire si elle a en ce point un maximum ou un minimum au_ sens 
strict, en négligeant les ensembles ¥t, et qu’elle posséde la propriété E, si 
elle possede au moins une de celles E et E. 

Comme d’habitude, nous dirons que la fonction f(x) est croissante [dé- 
croissante] sur l’ensemble H, si l’on a pour @,@€H, @e<f, linégalité 
fle) =f(® [f(@) = f(]. On dira qu’elle est strictement croissante [stricte- 
ment décroissante] sur H, si les mémes conditions impliquent f(@) < f(?) 
[f(@) > f(6)]. On dit que f(x) est [strictement] monotone sur H, si elle est 
ou bien [strictement] croissante, ou bien [strictement] décroissante sur cet 
ensemble. 
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On dit que la fonction f(x) est [strictement] monotone par segments 
mourn lensemble 7; sil existe une suite {x;}(i=0, + 1, + 2,...) de nombres 
réels tels que X;<Xix1,X: 2+ pour i>+0,x;~+~—oo pour i+—oco et 
que f(x) est [strictement] monotone sur chacun des ensembles [X;, Xii1]-H. 

Désignons par U l’ensemble composé par les points x,€R tels qu’on 
a (Xp), X + OVEN et (H—O, XH) EM pour tout d > 0. 

Dans ce qui suit, pour plus de briéveté, nous résumerons parfois les 
‘énoncés de plusieurs propositions de structure et de démonstration analogues 
en un seul énoncé; les changements nécessaires seront indiqués entre cro- 
chets et, au cas oi le nombre des propositions résumées dépasse deux, ils 
seront séparés les uns des autres par des points-virgules; quant a la démon- 
stration, elle ne sera détaillée en général que pour la proposition mentionnée 
en premier lieu. 


3. Nous sommes capables a présent de formuler les résultats principaux 
de ce paragraphe. 


THEOREME I. Si la fonction f(x) ne posséde la propriété E en aucun 
point dun ensemble S, mais elle y jouit de la propriété M* [M], on a 


@ 


S=> Sn, oi SCS et f(x) est monotone [strictement monotone] par seg- 


n=) 
ments sur chacun des ensembles S,. La premiére hypothése peut étre remplacée 
par celle SCU. 


THEOREME II. Les conditions du théoréme précédent étant admises, f(x) 
appartient sur S a la deuxiéme classe de Baire au plus. 


THEOREME III. Si les conditions du théoreéme | sont remplies et si, en 
outre, S est mesurable, a tout nombre #>0O correspond un ensemble mesu- 
rable S.cS tel que |S—S,.|<« et que f(x) est monotone [strictement mono- 
tone] par segments sur S.. 


La démonstration de ces théorémes se compose de plusieurs proposi- 
tions auxiliaires. a 
Gelrond kh—Uer 
DEMONSTRATION. En désignant par H, l’ensemble des points x, € R—U 
tels qu’il existe un 0 > 0 pour lequel on a (X),—0, %) € % et (X0, Xo + 0) € Nt, 
par H, |’ensemble des points x, € R—U tels qu’il existe un 0 >0 pour lequel 
on a (X),X% +90) €X, mais qu’on a pour tout ¢>0 (%—s, X) EN, enfin par 
Hy, celui des x,€R—U tels qu'il existe un O>0O pour lequel on a 
(%—9, X)€M, mais qu’on a pour tout «>0 (Xo, Xo e) EN, on a évidem- 
Pent. R— U =H, A, +-A,- Or, pour % ¢/1, il existe un 0 > 0 tel qu’on a 
(x, — 9, X) + 0) € J, et ceci entraine, en vertu du théoréme de Eee Ok que 
H,€N. Pour xX € Ah, il existe un 0 >O tel que (Xo, Xo + 9) € MN, done aucun 
point de l’intervalle (X),Xo-+ 0) n’appartient a H,, ce qui entraine que l’en- 


15* 
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semble H, est dénombrable, et la méme conclusion s’obtient pour H;; tout 
cela démontre la proposition. 

(3.2) Si f(x) ne posséde la propriété E en aucun point dun ensemble S, 
lensemble S—U est dénombrable. 

DEMONSTRATION. Avec les notations de la démonstration précédente, 
c’est évident que f(x) posséde les propriétés E et E en tout point de I’en- 
semble H,. Les ensembles H, et H, étant dénombrables, la proposition est 
la conséquence immédiate de l’égalité S— U— S(R—U) = S(H,+ H+ A,). 

La proposition suivante est une conséquence évidente des deéfinitions 
correspondantes : 

(3. 3) x) étant un point de l'ensemble U, aucune fonction f(x) ne peut 
avoir au point xX, en méme temps les propriétés C. et Dt [C* et D.; C_ et Dt; 
Cid CA Se8 BG b 

La proposition (3.4) qui suit coincide avec le théoréme (3. 23) de mon 
ouvrage [1] cité plus haut. 

(3. 4) Si f(x) jouit de la propriété E en tout point @un ensemble S, on 
Cesena 

(3.5) Si f(x) posséde au point x, la propriété C,(0) [C*(0) ; D.(0); 
D*,(0)] et si Ton a pour un point x, O<x,—xX<d0 et f(x,)—f(m) =0 
[<; =; >], F(x) posséde au point x, la propriété E [E; E; E]. Si elle posséde 
en x, la propriété C_(0) [C*(0); D_(0); D*(0)] et si fon a pour un point x, 
—0<xX,—%X%) <0 et f(%)—f(%) =0/>; =; </, elle posséde en x, la pro- 
DIC GR ie [Ee roncy 3 

DEMONSTRATION. Les hypothéses f(x.) = f(x) et O<x,—x)<0 en- 
trainent 


F| £0 —fe)_ 


36 —— 2,61 


= = UX = 


CELL) =f), XH <X< MIC 


| gl fe I(x) —F(%)_ — 0, Xo axe x40 € N, 


—Xp 


puisque f(x) jouit de la i C.(0) au point x. On a par un raison-_ 
nement analogue 


£| f=). 50, u<x<%+0/CElf@) = =F, M<X< Ht] 
= E fe9=09 =0, H<x<xH+d] ENR, 


et ces deux relations donnent ensemble la proposition a démontrer. 

Les propositions (3.6) découlent immédiatement de (3. 5), et celles 
(3.21) de (3.6). 

(3.6) Si f(x) ne posséde la propriété E ni en a, ni en 8, et si lon a 
«<f<«+0, Phypothése que f(x) posséde en « la propriété C,(0) [C2(0); 
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D,(0); D'(0)], ou qu'elle posséde en 8 la propriété C_(0) [C*(0); D_(0); D*(0)], 
entraine Vinégalité f(a) < f(@)[=; >; =]. 

(3.7) Si f(x) ne posséde la propriété E en aucun point d’un ensemble 
S de diamétre moindre que 0 et si elle posséde celle C, (0) (CAG) CAO) Geo} 
D,(0) ; D_(0) ; Di(0); D®(0)] en tout point de S, elle est strictement croissante 
[strictement croissante; croissante; croissante; strictement décroissante , stri- 
ctement décroissante ; décroissante ; décroissante] sur S. 

(3.8) Si f(x) ne posséde la propriété E ni en «, ni en 8, si elle jouit 
de celle C"(0) en «@ et de celle D*(0) en 8 et si |e—8|< 0, on a f(a)—f(6). 
La premiére hypothése peut étre remplacée par celle qu’on ait a, 8€ U. 

DEMONSTRATION. D’aprés (3.6), les hypothéses entrainent tant l’inégalité 
F(a) =f(8), que celle f(«@) = f(8), donc la proposition a démontrer. Si @, ? € GE 
il découle, en vertu de (3.3), de ce que f(x) posséde en @ et en @ ou bien 
la propriété C*, ou bien celle D*, quelle n’y posséde pas la propriété FE. 

(3.9) Si f(x) ne posséde la propriété E ni en a, ni en @, et si elle jouit 
de celle C(O) en « et de celle D(0) en 8, on a |a—| = 0. La premiére hypo- 
thése peut étre remplacée par celle qu’on ait «@, 8¢€ U. 

DEMONSTRATION. Sil’on avait |@—| <0, ceci impliquerait d’aprés (3. 6) 
les inégalités f(«) < f(@) et f(«) > f(2), ce qui est impossible. Quant a la der- 
niére assertion de l’énoncé, voir ld démonstration précédente. 

Les deux théorémes suivants présentent quelque intérét de ce point de 
vue que, dans leurs hypothéses, ne figurent que des conditions unilatérales 
concernant la fonction f(x). 

(3.10) Si f(x) ne posséde la propriété E en aucun point de ensemble S 
et si elle jouit en tout point de S dau moins l'une des propriétés C;, C*, D™ ou 


D* [C.,C_,D, ou D-], on a une décomposition S — >’ Sy, ott f(x) est mono- 
het 
tone [strictement monotone] sur chacun des ensembles Sh.” 


: 2 3 4 : 
DEMONSTRATION. Désignons par T®, T°, T et T® respectivement les 


ensembles des points x,€S tels que f(x) posséde en x, la propriété 


c:{—], ele p:(+| ou Dale: En employant la notation 
on ‘ t 
Cee Cen LL m+1 
igre eae Te Ee J n-+1 . 
“pour m0, 1; +2,...,7=1,2,... 4 i=1,...,4, on a évidemment 


a, 1) 
S= pes Tm» 


i,m, 


et d’aprés (3.7), f(x) est monotone sur chacun des ensembles 7y.. 


2 Elle est donc (VBG) sur l’ensemble S, cf. [2], p. 22s 
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(3.11) Si f(x) posséde en tout point @un ensemble S au moins lune 
des TE: c*,C*, Dt ou D* [C.,C_,D. ou D_], on a une décomposition 


S _—Nn+>S,, oit NER et f(x) est monotone [strictement monotone] sur 
k=1 


chacun des ensembles Sj. 
DEMONSTRATION. On n’a qu’a appliquer (3.4) et (3. 10). 
La proposition suivante coincide avec théoréme I. 


(3.12) Si f(x) ne posséde la propriété E en aucun point dun ensemble 


S, et si elle jouit en tout point de S de celle M* [M], on a S= DS, 04 


n=1 


SiS Siu et f(x) est monotone [strictement monotone] par segments sur chacun 
des ensembles S,,. La premiere hypothése peut étre remplacée par celle SCU, 


DEMONSTRATION. Soit S, lensemble des points x,€S tels que f(x) 
posséde en x, au moins une des propriétés c*{=] ou p*(4)} ic{ +] ou 


p+) | (n—1,2,...). On a évidemment S, Cc S,.1. En considérant pour un 
ik k+t 
tier k l smal, | Ree 

entier kK quelconque |l’ensemble S,,, == S,, Ez mae a 

points @€ S,;, et ES, tels que f(x) posséde la propriété oad Po Ge 


a, ou bien il existe deux 


eyait 1) 
en « et celle D Ba Ip (| en 3, et en ce cas f(x) est constante, donc 


monotone sur S,,, en vertu de (3.8) [cette possibilité est exclue d’aprés 
(3. 9)], ou bien I(x) posséde en tout point de S,, la mé€me_ propriété 


c(4| ou po! oe c(-] ou p(4] 
we ne ne 
tone [strictement monotone] sur S,,, daprés (3.7). En résumant nos con- 


clusions, on arrive a ce que f(x) est monotone [strictement monotone] par’ 
segments sur l’ensemble S,,. 


La proposition suivante est identique au théoréme IL. 


(3. 13) Les hypothéses de (3.12) impliquent que f(x) appartient sur S 
a la deuxiéme classe de Baire au plus. 


, et alors elle est également mono- 


DEMONSTRATION. En appliquant les notations de la démonstration pré- 
cédente, définissons la fonction f,(x) de fagon qu’elle soit égale a f(x) sur 
l’ensemble S,, qu’elle soit monotone sur chacun des plus petits intervalles 
J, (ouverts, fermés ou a moitié fermés selon le cas) qui contiennent les 
ensembles S,,,, et qu’elle soit constante sur chacun des ensembles [k, k +- 1] — 
(Sif Siig + Fix). Puisque f(x) est monotone sur chacun des ensembles 
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Six, on peut satisfaire aux conditions que nous venons de poser, On voit 
- immédiatement que f,(x)—> f(x) pour x € S. D’ailleurs chacune des fonctions 
f,(x) n’a qu’une infinité dénombrable de discontinuités au plus, elle est donc 
limite d’une suite de fonctions continues (pour le voir, rangeons en une 
suite {x,,X»,...} les nombres rationnels et les points de discontinuité de 
fr(x); en désignant par f(x) la fonction qui est égale a f,(x) aux points 


X,,+-+)Xr, a fr(@) pour x Se et a f,(6) pour x28, ou == Min (X45. - «5 Xn) 
et @—=max(X,...,Xx), et qui est linéaire entre deux points voisins quel- 


t—>O 


conques des points x,,..., Xx, on a lim fix(x)—f,(x) pour un x quel- 
} 


conque). La proposition en découle immédiatement. ; 

Nous pouvons enfin démontrer la proposition suivante, identique au 
théoréme III. 

(3.14) Si f(x) ne possede la propriété E en aucun point @un ensemble 
S, si elle jouit de celle M*[M] en tout point de S, et si S est mesurable, il 
correspond, a tout «>0, un ensemble mesurable S,cS tel que |S—S;|<é& 
et que f(x) est monotone [strictement monotone] par segments sur S. La pre- 
miére hypothése peut étre remplacée par celle SCU. 


DEMONSTRATION. Soit S,—=S-[k,k+1]; f(x) est mesurable sur Si, 
d’aprés (3.13). Un «>0 etant donné, on peut trouver donc en vertu du theo- 
reme de LusiN un-ensemble fermé FCS; sur lequel f(x) est continue et tel 
que iS oahloe 2 on peut encore supposer que F< (k, k+1). Dé- 
signons par Fin ensemble des points x, € Fi; tels que f(x) possede en x, au 
moins une des propriétes Gl ou D* Fh. En appliquant le raisonne- 


ment de la démonstration de (3.12), on constate que f(x) est monotone, sur 
Yensemble F;, et qu’elle conserve cette propriété sur la fermeture Fi, car; 
de Fin, puisqu’elle est continue sur F,.-Puisqu’on a FinG Fran e 


foo) @ 
a oe Leal ey 
F,= >) Fin, On a aussi Fin & yaa Cll = >) Fim, donc, Fin étant mesu- 


n=l n=l 


rable, on a pour un indice 1 suffisamment grand 


| Fx— Fin, | See ae ee 
Posons S:= >, Fin,3 Se est mesurable et, en vertu de la relation 
k=-@ 
S—S.c > [(Si— Fi) + Fe — Firm, 
k==0 
on a 
@ - Ad 3 
—|k|-3 ‘ altel Sy Maeno a as 
|S—S.|= Dez" ee Se 


D’aprés la relation Fin, © Fi CG i+ 1), ona S[k, K+ 1] = Fim, et FO) etant 
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monotone sur F;,,., elle est monotone par segments sur S., ce qu’il fallait 
démontrer. 

[Pour démontrer la variante entre crochets de la proposition, on définit 
les ensembles S, et /, comme avant, puis on désigne par F;, l’ensemble 
des points x,¢€F), tels que f(x) posséde en x) au moins une des propriétés 


[7] ou Dial On trouve que f(x) est strictement monotone sur F;,, et 
n- ie 


qu’elle conserve cette propriété sur l’ensemble Fin CS Fin © Fr; composé par 
les points d’accumulation bilatéraux de F;,,. L’ensemble Fy,—Fr, est évi- 
demment dénombrable, donc F;,, est mesurable et | F;,,! = |F;,,|. En choisissant 
Yindice mn, de la méme maniére que plus haut, on a 


| Fx— Fitn,| = | Fe— Firm | < 2-20, 


ioe} 
et en posant S.—= >’ Fi,,,, Se sera mesurable, on aura |S—S, 


k=-@ 
sera strictement monotone par segments sur S,.] 
Le théoréme suivant montre qu’une fonction ne peut posséder une méme 
propriété C, ou C*, ou D, ou D*, en tout point d’un intervalle que si elle 
y est monotone. 


(3.15) Si F(x) posséde la propriété C [C*; D; D*] en tout point de Vin- 
tervalle (a,b)—=ICU, elle est strictement croissante [croissante ;  strictement 
decroissante ; décroissante] sur I. La méme conclusion s’applique aux  inter- 
valles [a, 6], ou [a,b], ou {a, b], si, en dehors des conditions précédentes, T(x) 
posséde la propriété C! [C!; Dt; D'] en a, ou celle C* [C*; D*; D*] en b, ou 
toutes les deux, selon le cas. 


<e et f(x) 


DEMONSTRATION. Les hypothéses impliquent, d’aprés (3. 3), que f(x) ne 
posséde la propriété E en aucun point de /, donc, en vertu de (3.6) qu’elle 
est localement  strictement croissante (au sens classique) en tout point de /, 
et, au cas ot les conditions supplémentaires sont remplies, c’est valable 
meme pour le point a, ou 6, ou pour tous les deux. D’oit, par un raisonne- 
ment classique, on parvient a la proposition a démontrer. 


4. Dans ce dernier paragraphe, nous nous occuperons des questions 
de continuité généralisée, c’est-d-dire de continuité sous négligence des en- 
sembles Xi, des fonctions qui sont localement monotones lorsqu’on néglige 
les ensembles en question. Avant de les formuler, convenons d’abord des 
définitions suivantes. 

}(x) étant, comme toujours, une fonction réelle et finie, et Yt une famille 
d’ensembles qui satisfait aux conditions (2.1) et (2.2), désignons par 

limy f(x) 
a-Pity 


la borne inférieure (finie ou infinie) des valeurs y telles qu’il existe un inter- 
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valle ouvert / pour lequel on a x, €/ et 
Elf) > yl ex 
De facon analogue, soit 
limy f(x) 


a>Xy 


la borne supérieure des valeurs y telles qu’il existe un intervalle ouvert / 
pour lequel on a x,€/ et 


ELfCs) < y] eX. 
On voit immédiatement que x, € U implique 
(4.1) | limy f(x) = lims f(x); 


si le signe d’égalité est valable dans cette relation, la valeur commune des 
deux membres sera désignée par 

limy, f(x). 

T+ Ly 


La fonction f(x) est dite continue au point x, en négligeant les ensembles Yi, si 
F(X) = limy, ee} 


On constate aisément que cette définition de la continuité sous négligence 
des ensembles 9t équivaut a celle due a R. BAIRE (cf. [3], p. 202). 

Nous démontrerons le théoréme suivant qui fournit une généralisation 
d’un théoréme classique sur les discontinuités des fonctions monotones: 


THEOREME IV. Si f(x) posséde la propriété M* en tout point dun 
ensemble SCU, elle est continue en négligeant les ensembles Yi en tout 
point de S, excepté les points dun ensemble dénombrable. 


DEMONSTRATION. En désignant par r un nombre rationnel quelconque, 
considérons l’ensemble S, composé par les points x, ¢€S tels que 
limy f(x) << r<limy f(x), 


puis l’ensemble S; des points x,€S tels que 
limy, f(x) 7 i < f(X); 


enfin celui S/’ des points x,€S tels que 
F(X) ApS limy, f(x). 


U>Xo 


C’est évident que l’ensemble > (S +S; +8: contient tous les points de 


S ott f(x) n’est pas continue en négligeant les ensembles 3i. Il suffit donc 
de démontrer que chacun des ensembles S,, Si et Si’ est dénombrable. 
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Soit x, € S, et supposons que f(x) possede en xX, disons, la propriété 
C*. Si Von a f(x) =r, on aura pour un nombre 0 >0O convenable 


E(x) Sen J AEX ORG ++ O| CEs) < F(%); Xp xX< X) +0] € EN; 


Vinégalité x,<x,<x,+-0 entraine donc limy f(x) =r, Cest-a-dire que x, ne 


peut pas appartenir a S,. D’autre part, si f(x))</7, om aura pour un 0>0 
convenable 


E(f) = 1; Xp 0 A eX fe [f(x) > F(X), Xo —- I< xX < Xo] EU, 


Vinégalité x,—d<x<x, implique done limyf(x)=r, et par consequent 


>, 


x,¢S,. En tout cas, x, n’est pas point d’accumulation bilatéral de S,, et on 
arrive a la méme conclusion en supposant que f(x) jouit de la propriété D* 
en x). La dénombrabilité de S, en découle immédiatement. 

Soit x) € Si et supposons que f(x) posséde la propriété C* en x,. Ona 
pour un 0 >O convenable 


EB Biba ie eee ot] fe E Lf) <fGq). %~ = x= 44 Clee 


donc, pour x) <%,<X)+0, on a limyf(x) =r, ce qui entraine la relation 
THX, 


x,¢S; en vertu de (4.1), valable puisque x,¢€S—U. Par consequent, X, 
nest pas point d’accumulation bilatéral de S;; la méme conclusion s’ensuit 
de I’hypothése que f(x) posséde la propriété D* en x,. S; est donc, lui 
aussi, dénombrable. Un raisonnement analogue s’applique pour S/’, ce qui 
termine la démonstration. 


2 (Recu le 18 mars 1955.) 
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O ®YHKUMAX, JOKAJIGBHO MOHOTOHHbIX B OBUJEM CMbICJIE 
A. YWacap (Byganeur) 


(Pe 310 Me) 


Ilycrb % HacnepcTBenHas, o-anAMTMBHaA CHCTeEMA JIMHEMHbIX TOYCUHbIX MHOSKECTB. 


Tosopmum, uro dbyukuna f(x) nOKanbHO ‘t-MOHOTOHHA B TOKE Xp), ECAH CyueCcTByeT TaKoe 
MOMOKUTEMbHOe YHCIO 0, YTO MAK 


Bees my, baie cslen 
ne X— Xv 

MH 1*Ke 
E LO)—FEo) >0, 0< |x—x| <dI/EN. 
av x—Xp 


Nycrh U muoxkecTso TOUeK Xy YHCAOBOM MPAMOH, [WIA KOTOPHIX Mpu BCAKOM 0 > O 
UMeCT MECTO (Xp, Xo f- OVEN U(X, XN EN. | 

Tnapypie pesyabtaThi paooTbl COCTOAT B CieAyOuleM: 

Ecau tpynkunsa f(x) 10KambHO Yt-MOHOTOHHA BO BCEX TOYKAX MHOKECTBA Ses CATO 


oo 
a 
iS =>, S,, rae SC Sy41 u f(x) KyCOUHO MOHOTOHHA Ha BCAKOM 3 MHOKECTB S,. lp 


m=1 
Tex Ke ycuoBuax f(x) Ha MHOxKeCTBe S HE MOKET NPMHAMIEKATh K1aCCcy Bapa Bpiue BTO- 
poro. Ecam mp ykasaHHbIx yCAOBUAX MHOMKECTBO S ABAAACTCA WM H3MEPHMbIM, TO [MIs 
mo6oro MOAOKNTeMBHOrO ¢ MOXKHO HaiiTH TakKoe usmepuMoe MHOKeCTBO S;CS, TO 
|S—Se| <u cbyuxuusa f(x) kycouno MOHOTOHHa Ha S-. Hakoneu, Np NPOKHUX yCAOBHAX 
f(x) nenpeppisua Bo Bcex TouKax S, XOTA Obl 3a MCKTIOUEHHEM CHCTHOTO MHOXKECTBA TOMEK 
ecu mpeneOperath MHOoKeCTBAMH X. 
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A NOTE ON SUBDIRECT PRODUCTS 


By 
ISIDORE FLEISCHER (Paris) 


(Presented by G. Hajos) 


In a previous paper [3] L. Fucus has proved that for groups, rings, 
or Boolean algebras, every subdirect product of two systems can be realized 
as the set of all couples whose components have equal images with respect 
to a pair of homomorphisms defined on the systems; and he has suggested 
that this property is related to the fact that homomorphisms of such struc- 
tures are completely determined by the set of elements congruent to a zero 
element. In this note the validity of the theorem for more general algebraic 
systems is discussed; it is shown in particular that the result depends on a 
completely different property of these structures: namely, the permutability of 
their congruence relations. 

Without being overly specific, let us agree to call algebra a set A in 
which various algebraic laws operate some of which may even involve ope- 
rators from some set outside A. It is known that a quotient algebra is com- 
pletely determined by an equivalence relation + in A which has the substi- 
tution property for all the algebraic operations concerned; this property en- 
ables one to transfer the operations from A to the set of equivalence classes 
A/S. 

We shall need the following concepts from the theory of equivalence 
relations: One writes *c.# and one says that # is contained in (or implies) 
# if every class of % is contained in a class of #. Thus # induces a 
unique equivalence relation in A/* and every equivalence relation in A/+ is 
induced in this way (First Isomorphism Theorem for equivalence relations). 
The classes of the conjunction of # and #, #n#, are by definition the 
non-void intersections of a class of # anda class of #. The product #9 is 
defined as the binary relation: xx’ if there exists a y with x.y and 
yx’. In case *# equals #9, J and # are said to be permutable: this 
is the necessary and sufficient condition that 29 be an equivalence relation 
(and hence the smallest equivalence relation containing # and 7’). 

The following Lemma is the essential step in the proof of a Second 
Isomorphism Theorem for equivalence relations. 


Lemma. The class of * containing x intersects the class of # containing 
ex if and only if x3 # x. 
We turn now to subdirect products. 
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Corresponding to a subdirect product representation of A there exist 
two projections onto the factors which in turn give rise to congruence rela- 
tions @ and #; the fact that distinct elements of A have at least one un- 
equal component implies that ¢n#— «, the identity relation. Conversely, 
two such congruence relations yield an embedding of A as a subdirect pro- 
duct of its quotient algebras A/* and A/.%.’ 

When will A, represented ‘in this way, be the collection of all couples 
having the same image by a pair of homomorphisms sending A/# and Al’ 
into a fourth algebra? Observe that every function on A # induces in A an 
equivalence relation * containing ; the same relation must be induced by 
the function on A/%’, because the components of a couple coming from an 
element of A are to be sent on the same element. Translated into an asser- 
tion on equivalence classes in A, the requirement that every couple whose 
components have the same image come from an element of A reads: A class 
of and a class of # contained in the same class of # always intersect. 
According to our Lemma, this can only happen if #* — 9. Conversely, if 
and # are permutable, so that 9*—%”# is an equivalence relation, then 
A is represented in the desired manner with respect to the mappings of A/+ 
and A/% onto A)". 


THEOREM. A necessary and sufficient condition that a representation of 
A as a subdirect product of A/S and A ¥ consist of all pairs whose compo- 
nents have the same image by a pair of homomorphisms, is that % and ¥ 
be permutable. 


CorOLLARY. /f for a class of algebras every pair of congruence relations 
is permutable, then every subdirect product is of the type described in the 
Theorem. 


All the algebraic structures discussed in [3] are examples of groups 
with operators; for these the congruence relations are given by normal sub- 
groups and hence are all permutable. 

On the other hand, let G be a non-commutative group and take for the 
algebras sets A admitting G as operators on the left. Of course CG is itself. 
such an algebra, and by following through the usual proof of the homomor- 
phism theorem one easily verifies that the congruence relations on G are just 
its decompositions into the left cosets of a subgroup.’ Now if H and H’ are 
subgroups of G which do not commute, the congruence relations they define 
will not be permutable; therefore the representation of G/HnNH’ as a sub- 
direct product of G’'H and G/H’ will not be of the desired type. 


' For the most general possible algebras it may happen that the operations of A/® 
and A/® do not induce exactly the operations of A; this in no way affects the discussion. 

* This is therefore a type of structure in which such a relation is determined by the 
class of elements equivalent to a neutral element. 
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In conclusion, we might remark that the remaining theorems 3—7 of 
[3] are easily proved in the general framework of our discussion by a con- 
sistent use of the correspondence between homomorphisms and congruence 
relations. 


(Received 4 May 1955) 
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3AMEUAHHE O NOANPAMBIX MPOMSBEAEHUAX 
YU. Pnenmep (Napwx) 


(Pes Me) 


ah. PyKc yoKasaa, uTO B Cayyae rpynn, Koney unm G6yneBbIx aredp BCAKOe 
MOANpamMoe mpousseyenne ABYX CUCTEM NpeACTABAAeTCA KAK COBOKYNHOCTbh BCEX TAKUX Map 
aMeMeHTOB, 4YTO OOPasbl ABYX KOMMOHEHTOB Mapbl MpH HEKOTOPbIX romMoMOp(pu3Max COBMa- 
naror. B nacrosmen padoTre aBTOPOM fOKaspIBaeTCA, YTO B CAydae m1000n amreOpanyeckon 
cucremp1 A mM mOObIX COOTHOWIeHHM KOHTpyeHTHocTH # u # mpepAcTaBieHne A B Bue 
nosnpamoro npoussefenua A/F u A/ ocyuyectBasetcaA BCeMM TapaMn 3e@MEHTOB CO COBTa- 
arouluMu AIA HEKOTOPBIX rOMOMOp(u3MOB OOpasamu TOrAa M TOKO TOTAa, CCIM ou ow 
nlepeCTaHOBOUHBEI. 


UBER DIFFERENZIERTE FOLGEN DER LAGRANGESCHEN 
INTERPOLATION 


Von 
G. FREUD (Budapest) 


(Vorgelegt von G. Atexits) 


1. In vorliegender Arbeit wird folgendes Problem behandelt: Es sei f(x) 
eine m-mal stetig differenzierbare Funktion; wir betrachten die Lagrangeschen 
Interpolationspolynome dieser Funktion beziiglich des Grundpunktsystems 
Gaps 


LaF; x) — > Fetn) bn), 


Bilden wir die m-ten Derivierten L\”’(f;x) der Interpolationspolynome und 


suchen hinreichende Bedingungen fiir das Bestehen von 


lim L& (f; x) =f” (x). 


10 


Es werden die Faille behandelt, wo die {x;,} Nullstellen einer orthogo- 
nalen Polynomenfolge sind. Wir werden zwei Satze beweisen. In Satz I wird 
beziiglich des Orthogonalpolynomsystems nur die recht allgemeine Bedingung 
(2) vorausgesetzt, dann mu aber die Funktionenklasse, zur welchen f(x) 
gehort, starker eingeschrankt werden. Fiir m=O geht Satz I in einen ent- 
sprechenden Satz der Theorie des Lagrangeschen Interpolationsverfahrens 
iiber, welcher schon eingehend behandelt wurde (vgl. J. SHoHAT [8]; G. 
GRUNWALD und P. TurAN [6]; P. ERD6s und P. TurAN [2], S. 527; G. 
ALExITS [1]). 

Im Satz Il werden beziiglich des Orthogonalpolynomsystems scharfere 
Voraussetzungen getroffen (vgl. (12) und (13)), aber die Funktionenklasse, 
auf welche unser Satz anwendbar ist, wird wesentlich ausgedehnt. Setzt man 
in Satz Il m—0O, dann erhdlt man ein friiheres Resultat des Verfassers [5]. 
Die Voraussetzungen (12) und (13) sind erfiillt, wenn w(x) =(1—)"(1 +x)? 
mit @,@>—1 ist, in welchem Fal] die p,(x) mit den Jakobischen Polynomen 
identisch sind. 

Die Satze I und I] werden aus der Abschatzung der Summe 


es | a (x) | 


b= 


gefolgert, welche die Rolle der Lebesgueschen Funktion unseres Grenzpro- 
zesses spielt. Der Beweis ergibt sich aus einer Kombination zweier Verfah- 
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ren, die in zwei vorigen Arbeiten des Verfassers ([4], [5]) auseinandergesetzt 


wurden. 
Am Ende der Arbeit wird gezeigt, da die Ungleichung fiir kein Grund- 


punktsystem durch eine der Gréfenordnung nach scharfere ersetzt werden kann. 


2. In der Arbeit [5] des Verfassers wurde folgendes Problem behandelt = 
<t,(x) durchlaufe alle Polynome héchstens n-ten Grades mit 
tI 


(1) | [7 1) PwOdt= 


|\ 


1 (0 = w()€L) 


und man suche das Maximum M,,,,(x) von 708") (x). Es wurde gezeigt, dab. 


Mou) =} por(aor 


ist, wobei p,(x) jenes normierte Orthogonalpolynom y-ten Grades bedeutet, 
welches zur Gewichtsfunktion w(x) und zum Orthogonalitatsintervall (—1, + 1) 
gehort. Es wurde ferner gezeigt, dai unter der Voraussetzung 


(2) w(x)=u>0 fir a=x<b  ((a,b)c(—1, +1)), 


in jedem inneren Teilintervall von (a, 6) die Abschatzung 


Ae ae 
(3) Most Ole 
gleichmafig besteht. Wir wollen jetzt M,,,(x) mit den Derivierten der — 
Lagrangeschen Grundpolynome ausdriicken. Es seien Xin, X2n,--+; Xnn die Null- 
stellen von p,(x) und die Lagrangeschen interpolatorischen Grundfunktionen, 
die zu diesen Grundpunkten gehdren, seien /,,(x) (k= 1,2,...,2). Infolge 
der Gaufi—Jacobischen mechanischen Quadraturformel gilt 


(4) | bn eorweax > boners Gn)P, 


und aus der Lagrangeschen Interpolationsformel erhalten wir 


nt 


(5) Ton} (x) : De JUy-1 (Xin) In (x). 
k=] 
Hieraus folgt unter Beachtung von (1) und (4) 


“} 1 1 
(ni : 2 2 1 
gee 1(x) = a4 pips | 7 Ty -1 (X;, 4) | Ai n fe (x) | = 


_ 


Simson! User SLOP 
=| > tal " (in) PY > s|> ise: 


to] 
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und die Gleichheit wird tatsachlich erreicht, falls 


ss Ses PCAG) 


Ft,-1 (C= he din se 
oad 69) a 
(= inn - \ 


ist. Mit Hilfe von (4) zeigt man leicht, dafi mit dieser Wahl von /r,-; auch 
(1) befriedigt ist. Somit wurde gezeigt, dah 


ANS [ie GOL P 
(6) Ms, m(X) =} 27 
gilt. Dieser Zusammenhang (sowie die Ungleichung (7), die wir aus ihr fol- 
gern) wurde andeutungsweise und ohne Beweis schon in einer Arbeit von 
P. Erpos und P. TurAn ([2], S. 525) ausgesprochen. Aus (3) und (6) folgt 


: len y 
Tf N U = O yr 
( ) — hie ( ) 
gleichmafig in jedem inneren Teilintervall von (a, 0). Somit gilt wegen 
+1 
> hin = w(x)dx auch die Abschatzung 
c—1 . 
a ie 
1 1 ; 
- n rf  " Vo 4 2 (mn 2) Dy 2 ee 2s 
8) S@) = (Dan) | EOL! — ola) 
i=l il (= 


gleichmafig in jedem inneren Teilintervall von (a, 0). 


Satz I. Als Grundpunkte der Lagrangeschen Interpolationsfolge L,.(f;X) 
wahlen wir die Nullstellen von Orthogonalpolynomen, welche durch eine die 
Bedingung (2) befriedigende Gewichtsfunktion w(x) bestimmt sind. Die Funk- 
tion f(x) sei in [—1, +1] m-mal stetig differenzierbar und es sei f(x) €Lip « 


ae dann gilt gleichmdpig in jedem inneren Teilintervall von (a, b) 


ge ge 
(9) im Tex) = fo (x). 
Die Forderung f(x) € Lip mit «> > kann durch folgende schwdachere 
ersetzt werden: es gilt gleichmafig in x, und x, (—]l=™%, %=S+ 1) 
| i 
(10) $3) fs) =0 (| —m i?) 


Bewels. Laut (10) gibt es Polynome héchstens n—I-ten Grades y,(x) 
fiir welche gleichmahig in x €{[—1, +1] 


(1) nd) =oln 


* 16* 
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und 


= 
sie 
ae 


ips (x)— yy (x)= 
besteht. Aus der Identitat 


Wal) — SY Wain) @) 
folgt durch m-maliges Difterenaieren 
(12) yx) = > wan) A. 
Endlich ist wegen (12) und (8) 
(3) 0 F.2d) =| SM) — Yolen] 2) +0 [n=] 


SS 


= <= Max | f(Xin) —Wn(Xkn)| > zl 14 09|-+0(a 2 reat 
w. z. b. w. 


3. Im weiteren soll die nichtnegative Gewichtsfunktion w(x) € ZL und die 
dazu gehdrende Folge der normierten Orthogonalpolynome ({p,(x)} den fol- 
genden starkeren Voraussetzungen geniigen: 


Sei 
(13) B= w(x) Zig 0 fir axa 
und 
(14) lp(xy|2ek* tir aSsexe by n=O 


Satz Il. Sind die Bedingungen (13) und (14) erfiillt, ist ferner f(x) in 
[—1, +1] m-mal stetig dufefenaic Bat und 
(15) (O(n) ie ==i9) log’! Ix, ag | fiir (0 Base Ce oy b; 
so besteht (9) gleichmdpig in jedem inneren Teilintervall von (a, b). 


BEwEIs. Sei (a@,,0,) ein festes inneres Teilintervall von (a,6) und 
x€(a,, 6;). Nach den Ergebnissen der Arbeit [4] des Verfassers gilt unter den 


Bedingungen (13) und (14) : 
(16) ee | Lin (x) | = O(log n) 
vy, E (ay, by) 
und 
(17) y [Lien (X)| - O(1), 
a EE (ay, Oy) 


wobei diese Abschatzungen gleichmabig in x bestehen, falls x im inneren 
Teilintervall (a,, 6,) von (a, 6) variiert. Es bestehen also dieselben Abschiat- 
zungen auch fiir die Summen 

De Een Ih (x) und SS Ekn lin (x) 


~ — 
hn € (ay, by) od qe (ay, 0,) 
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wo die Zahlen «,, die Werte -+ 1, —1 und 0 in beliebiger Anordnung annah- 
men. Nach der Ungleichung von BERNSTEIN ist somit 
Se (m) m 
2, &nlin (xX) = 
et ait (x) = O(n" log n) 
und 
eS: pon) m 
Lal enl n = . 
eGass : SS aA ) 
Diese Abschatzungen gelten gleichmabig in x fiir jedes innere Teilintervall 
von (a,, 6,) und die numerischen Konstanten sind sogar von der Wahl der 
Zahlen ¢;,,, unabhangig. 


Wahlen: wir 
en — 8g bin (X); 
dann erhalten wir 
(18) > Dy ole GO| — O(n" log n) 
und 
(19) | = ide | = O(n’). 
ay Or» Oy 


Wir betrachten jetzt die Funktion f(x). Wegen der Annahme (15) gibt 
es nach bekannten Satzen eine Polynomfolge {p(x}, so da (x) von 
hdchstens n-tem Grade ist und die Beziehung 


\ o(n-™ log n) (x € (a, 5:)); 


20 a | 

( ) f( ) Y ( ) lo(n-”) (x€ (a, b,)) 
besteht. Hieraus ergibt sich infolge der Bernsteinschen Ungleichung 
(21) f™xy—yn(xy—o(1) EG, ))- 


Der letzte Teil des Beweises verlauft nun aut altbekanntem Weg : 
(22) FOR) — LO (F=f CO) — Yor 1) — Ln (f—Wn13%); 
wegen (18), (19) und (20) ergibt sich somit 
2) (f—Yn13 x)| S0(0™ logan) a li G0) | 


: (23) . Choy E(A45 Oy 
toa) > [se |=o0). 
PpnE(Ay iy) 


Aus (21), (22) und (23) folgt unmittelbar die Behauptung unseres Satzes. 

Es bleibt noch iibrig zu zeigen, dai die Abschatzung (18) fiir kein 
~Grundpunktsystem verbessert werden kann, nicht einmal dann, wenn man 
auf die Forderung, daB die {Xin} Nullstellen eines Orthogonalpolynomsystems 


seien, verzichtet. 
Wir setzen voraus, es gebe eine Grundpunktmatrix {Xin} fiir welche 


(24) S| IS? (x) | = enn” log n, &, > 0 
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gilt und leiten daraus einen Widerspruch her. Betrachten wir dazu das lineare 
Funktional 


(mn Me / 
(25) A.(g) = LS } | Jos yp (thdt; x; 


Es sei g(t) eine stetige Funktion “3 M das Maximum des Betrages von 
g(t) im abgeschlossenen Intervall [—1, -+- 1]. Die Funktion 


D(x) = | (x—1)" "y (dt, 
| 
deren m-te Ableitung gleich g(x) ist, kann infolge des Satzes von D. JACKSON 
mit einem Polynom héchstens n—1-ten Grades w,,_;(x) approximiert werden, 
so daf 


ig (x) =P (x) | — C, Mn 
besteht, wobei C,, eine nur von m abhangige positive Zahl bedeutet. Man 


erhalt hieraus mit derselben Schlu®Bweise, wie am Ende des Teiles 2 dieser 
Arbeit 

(26) | p(x) —A,(¢)| = Cre, log n-M, 

wo auch C;, nur von m abhangt. Das lineare Funktional (25) hat die Eigen- 
schaft, dafi es jedes Polynom héchstens n—m—J1-ten Grades in sich tiber- 
fiihrt. Aus einem Lemma von LOsINSky, CHARSCHILADZE und NIKOLAJEW (vgl. 
I. P. NATANSON [7], Anhang 3, Lemma 3 und L. Fryer [3]) folgt aber, daf 


(26) falsch ist, die Voraussetzung (24) kann also nicht bestehen, womit der 
angekiindigte Widerspruch hergestellt ist. . 


(Eingegangen am 1. Juli 1955.) 
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lr. @pang (Byganewr) 
(Pe3 1 Me) 


Tyctp {p,,(x)} cucrema MHOrO4eHOB OPTOFOHAJIbHbIX OTHOCHTC/IBHO BeCOBOM (pyHKUMM 
O<w(X)EL 15x55 )), Xn) Xonr +++) Xyn KOPHH MHOrOUTeHA n-oll creneHn p(x), a 
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Tyctb f(x) dbynKunsa, m-KpaTHO HeNpePbIBHO audcpepenunpyema Ha cermente [—1, +1], 
M nyCTb 

Vw 
m) ae ae e On) (¥ 
LO? (f5 x) => f Xin) fin @D.- 
c=L1 

Ecnu aaa x €(a, b) umeet Mecto w(x) =“ > 0, TO BO BCAKOM BHYTPeHHeM NOAMHTEp- 
Bane unTepsana (a, b) umeem 
Sy (m) ( yes 3] 

mn 2 
> 1@|=Oln 


ha | kn 
k= 


a 


PaBHOMePHO MO X, a CNeMOBATeAbHO, eCIM f(x) na [—1,-+- 1] paBHomepHo yfoBaetTBoOpseT 
‘yCMOBHIO 

1/ 
X1—Xe| 7), 


f (x1) —f (Xs) = 0 ( 


+O BO BCAKOM BHYTPeHHeM MopMHTepBane uHTepRana (a,b) uMeeT MeCTO lim LMG) = 
n— 00 


i= 


— f(x), pasnomepxHo m0 x. 

Ecau oe pa x € (a,b) umeet mecTo ¢ry = W(X) = 2 > 0, u B TOM %Ke HHTepBae 
HOPMMPOBaHHbIe OPTOFOHAIbHbIe MHOTOUACHbI Pp, (X) OrpaHu4eHb! B COBOKYMHOCTH, TO B3AB 
TPOMSBOMbHbIA BHYTPeHHUMM NOAMHTepBall (a,, 6;) unteppana (a, 6), BO BCAKOM BHYTPeHHeM 
nomuuteppane us (a,, 5;) UMeI0T MeCTO, PpaBHOMePHO N10 X, COOTHOWEHN 


@ DS [LE|=0@" tog a) 
Xe E44, 01) 
Mu 
rt) ie | am) (x)| ase O(n"). 
Ben E€ (M1; b1) 
Vs (1) u ua (Il) Bbirexaet, uTo ecam 
x1) —f (xo) =0 [ioe (aX, X=), 
Px, 10 Send 


‘TO BO BCAKOM BHYTPeHHEM MOAMHTeEpBae HS (a, b) paBHOMePHO BbIMOTHACTCA 

: Mm) fF. __ ¢(m) 

lim LO (f; x) =f" @)- 
e MOKeT ObITh yAYUIUeHAa HHKAKIM BbIOOPOM 
B) CHUCTEMbI OCHOBHbIX TOUeK. 
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ON GROUPS EVERY CYCLIC SUBGROUP OF WHICH 
IS A POWER OF THE GROUP 


oteh) 
F. SZASZ (Debrecen) 


(Presented by L. REépEt) 


To the memory of my beloved master T. SzeELe 


§ 1. Introduction 


In recent years many group-theoretical investigations originated with the 
purpose of giving an explicit characterization of some class of groups defined 
by some fixed property. The present paper is devoted to a similar problem. 

Let k be a fixed natural number not necessarily different from zero and 
let G be an arbitrary not necessarily abelian group written multiplicatively. 
The k-th power of the group G is a subgroup denoted by G", generated by 
the set of the k-th powers of all elements of G. 

We shall call an arbitrary group G a group with property P, if to every 
cyclic subgroup H of G there exists a natural number & for which H = Gy 
holds. Every cyclic group is a group with property P. The aim of this paper 
is to give an elementary proof of the converse statement, namely we are going 
to prove that a group with property P is necessarily cyclic, i.e. property P 
is characteristic for cyclic groups. 


§ 2. Preliminaries 


The characterization to be given of cyclic groups will be more easy 
to survey, if we prove first of all three lemmas. Before this, let us make 
some terminological remarks. 

We shall not assume the commutativity of the groups considered and 
therefore we use multiplicative notation throughout. We denote the order of 
the element g by the symbol O(g). A group is called torsion free if it con- 
tains no element of finite order other than the unity. On the other hand, 
groups every element of which is of finite order are called forsions groups. 
If a torsion group G contains an element of maximal order m, then we say 
that G is an m-bounded group. A group is termed a p-group if all its ele- 
ments have orders which are powers of the fixed prime number p. A finite 
p-group always has a non-trivial center [2]. In any finite group G of order 
a Ps Do Pe where P,,--+)Pjs+-++» DP, are different prime numbers, there 
exists necessarily a p,-subgroup of order p%', called a Sylow p,-group of the 
group G [2]. A group is called metabelian if its center contains its derived 
group, i.e., the subgroup generated by the commutators [a, 6]}=-a'b'ab of 


1 The numbers in brackets refer to the Bibliography given at the end of this paper. 


416 F, SZASZ 


all group elements a and 6. In metabelian groups the relation [a, bc] = 
— fa, b]-[a,c] holds for arbitrary elements a, bre 12h: 

Now we prove the lemmas. 

LemMMA 1. A group with property P is a torsion free or a finite group. 

Proor. Let G be an arbitrary not torsion free group with property P; 
and let g € G where O(g): -n>1. If {g}—G", then G is obviously an m- 
bounded group, where m= nk. In this case the set of all different powers 
of G is finite. Therefore the number of all cyclic subgroups of G is also 
finite, hence the torsion group G contains but a finite number of elements. 

LEMMA 2. Every homomorphic image G’ of a group G with property Pi 
is a group with property P. 

Proor. Let G be an arbitrary group with property P and g a homo- 
morphic mapping of G onto the group G’. If H’ is an arbitrary cyclic sub- 
group generated by the element h’ of G’, then there exists an element h of 
G for which hg—h’ holds. Let {4}—H=—G*" and thus h= g{---gt with 
certain elements g,,...,g, of G. Obviously, we have Hy =H’ and h’ = 
=(g,¢)'-:-(g,g)", whence (G")y —(G’)'. On the other hand, if g€ G, then 
(2")9 =(g¢)' €H@, therefore we can write (G’)' <(G")g, and thus H’—(G’)". 

LemMaA 3. A finite group with property P has always a non-trivial 
center. 

Proor. Let « be an arbitrary endomorphism of the group G with pro- 
perty P and H a cyclic subgroup of G. Then, by the proof of Lemma 2, 
(G')«—=(Ge)" is valid for any natural number n, and thus H= G* implies 
He = (G")e= (Ge)" & G' — H. But then every subgroup S is also mapped 
into itself, because g@€S implies {g}CS and gece {g}*& {eg} CS for every 
endomorphism ¢ of the group G. Thus every Sylow p-group of a finite group 
G is normal in G, and so G is the direct product of its Sylow p-groups. 
Since finite p-group is never without center and the center of a direct pro- 
duct is the direct product of the centers of the direct factors, therefore G has 
a non-trivial center. 


§ 3. A characterization of the cyclic groups 
Now we prove the following 
THEOREM. An arbitrary group is cyclic if and only if it has property P2 


* By our theorem it is clear that if a group G has property P then to every sub-— 
group S of G there exists a natural number n, for which S=G" holds. In a_ previous 
paper written in Hungarian with German summary (Uber zyklische Gruppen, Acta Scien- 
tiarum Universitatis Debreceniensis de Ludovico Kossuth nominatae) 1 have proved this 
theorem in the following weaker form: if for every subgroup S of a group G there 
exists a natural number n for which SG" holds, then G is necessarily cyclic. The proof 


of this weaker theorem made use of the fundamental theorem of R. Barr on the structure 
of hamiltonian groups [1]. 
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Proor. Let first G be an arbitrary finite group with property P and 
let m be the order of G. In this case we prove our statement by induction 
on m. The theorem is trivially true for m—1, and we assume that it holds 
for all finite groups with property P of order s less than n. By Lemma 3 
the center C of G differs from {1}. By our induction hypothesis the factor 
group G/C is cyclic, because it is by Lemma 2 a group with property P 
and on the other hand the order of G/C is <m. Considering that the fac- 
tor group with respect to the center is never cyclic, we conclude that G is 
a finite abelian group with property P. By the fundamental theorem on finite 
abelian groups there exists in every Sylow p-group S,-={1} of G a cyclic 
direct factor Ap+-{1} of S;, so that S,—A,>B, with a certain subgroup 
By of Sy. But A, == G' and G=A, x B, x M imply A, = At x B* x M". Here 
we must have B,—=M"={1} and A, = Aj, so that (kp) =1. Then B, = {1}, 
and thus each p-component of G being cyclic, G itself is a finite cyclic 
group. 

If G is infinite, then, by Lemma 1, the group G with property P is 
necessarily torsion free. Let now a and 0 be arbitrary elements of G. The 
subgroup 7= {a, b} is metabelian, because by the proof of Lemma 3 every 
subgroup of G is normal, therefore the commutator c—[a, b]—a'b"'ab is 
contained in the intersection {a}{b}, and so in the center of the subgroup 
T of G. If c= a’ — b¢, then c” — [a, b]” = [a’, 6] =[c, c] =1 and thus [a, 6] =1. 
Therefore G is an abelian torsion free group. If n==0, then the mapping 
of G into itself, where gy —g", is an isomorphism. Let g@€G and g=—1. 
If {g}—G", then G itself is necessarily cyclic. 

On the other hand, every cyclic group has obviously the property P; 
this completes the proof of our Theorem. 


(Received 4 July 1955) 
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BEMERKUNG ZU EINER ARBEIT VON T. SZELE 


Von 
OTTO STEINFELD (Szeged) 


(Vorgelegt von L. Répvet) 


Herrn Professor L. Katmir zum 50. Geburtstag gewidmet 


§ 1 


Wir nennen den Unterring (das Ideal, das einseitige Ideal usw.) a des 
Ringes R trivial, wenn a=(O) oder a—R ist. T. SZELE hat in einer vor 
kurzem erschienenen Arbeit folgenden Satz bewiesen : 

Ein nur triviale Linksideale enthaltender Ring ist entweder ein Schief- 
kérper oder ein Zeroring mit p Elementen, wobei p eine Primzahl bezeichnet.' 

Natiirlich gilt dasselbe auch fiir die Ringe, die nur triviale Rechtsideale 

s enthalten, deshalb bekommen wir sogleich folgende 

FOLGERUNG. Enthdlt der Ring R mindestens ein nicht-triviales Linksideal, 
so besitzt er auch mindestens ein nicht-triviales Rechtsideal. 

Wir werden in unserer Arbeit aus einem gegebenen nicht-trivialen Links- 
ideal des Ringes R ein nicht-triviales Rechtsideal von R bestimmen. In der 
Bestimmung des Rechtsideals spielen die linksseitigen und die rechtsseitigen 
Annullatoren eine wichtige Rolle. Es bezeichne H eine Teilmenge des Rin- 
ges R. Das Element ¢ von k, wofiir die Bedingung 

oH = (0) 

gilt, nennen wir einen linksseitigen Annullator von H. Es ist klar, dafi alle 
linksseitigen Annullatoren von H ein Linksideal von R bilden. Dieses Links- 
ideal heiBt das annullierende Linksideal von H, und wird mit br bezeichnet. 
Ebenso konnen wir das annullierende Rechtsideal von H definieren, welches 
‘mit rz bezeichnet wird. 

Wir brauchen zu den folgenden den Begriff des Quasiideals.* Wir nen- 
nen den Untermodul a des Ringes F ein Quasiideal, wenn fiir a die Bedingung 


(1) RanaREa 


1 T. Szete, Die Ringe ohne Linksideale, Buletin Stiinfific (Bucuresti), 1 (1950), S. 
783789. Im Zusammenhang mit diesem Satz machte mich Herr Professor L. Réper daraut 
aufmerksam, da® dieser Satz ein Korollar des Wedderburn—Artinschen Satzes der halbein- 
fachen Ringen ist. 

2 Das Quasiideal wird zuerst in unserer Arbeit ,,On ideal-quotients and prime ideals“ 
(Acta Math. Acad. Sci. Hung., 4 (1953), S. 289—298) definiert. Es ist leicht zu sehen, dab 
‘man den Begriff des Quasiideals fiir den Doppeltoperatormodul verallgemeinern kann. 


480) O. STEINFELD 


gilt. Es ist klar, da die Ideale, die einseitigen Ideale und der Durchschnitt 
eines Links- und Rechtsideals alle Quasiideale vom Ringe R sind. Wir wer- 
den hier beweisen: Wenn der Ring R mindestens ein nicht-triviales Quasi- 
ideal enthalt, dann enthalt R auch nicht-triviale Links- und Rechtsideale. 
Weiterhin bestimmen wir aus einem gegebenen nicht-trivialen Quasiideal 
des Ringes R ein nicht-triviales Links- und Rechtsideal von R. 


§ 2 


Wir werden jetzt aus einem nicht-trivialen Linksideal des Ringes R aus- 
gehend ein nicht-triviales Rechtsideal von R bestimmen. Es gilt der folgende 


Satz 12 Ist a ein nicht-triviales Linksideal vom Ringe R, so gibt es unter 
den folgenden Moduln mindestens ein nicht-triviales Rechtsideal : 

1. @R fiir ein geeignetes Element «(€a); 

2. die Menge der in « enthalteten linksseitigen Annullatoren von R, d.h. 
antes 

3. das annullierende Rechtsideal vq eines geeigneten Elementes @ von a; 

4. die Menge der (in R enthalteten) linksseitigen Annullatoren von Q, 
tel. 


BEWEIS. 1. Gibt es ein Element ¢ in a mit 
(44 R= os 


so ist offenbar «R ein nicht-triviales Rechtsideal von R. 
2. Wenn wir kein solches Element @(€ a) finden, so mus fiir irgendein 
Element §(€ a) entweder 


(2) ER= (0) (§ Ea) 
oder 
(3) eR (E €a) 


bestehen. Sei $(++(0)) ein Element von a, wofiir (2) richtig ist. Da dieses 
Element §(€ a) ein linksseitiges Annullator von R ist, ist die Menge der in — 
a enthalteten linksseitigen Annullatoren von R, d.h. der Durchschnitt > des 


Linksideals a und des annullierenden Linksideals {, von R vom Nullideal 
verschieden : 


d= I[rNa= (0). 
Wegen )©acR ist > auch von R verschieden. Nachher brauchen wir nur 
zu zeigen, dai >) ein Rechtsideal von FR ist. Da es fiir ) nach der Definition 


* Pur die gefdllige Hilfe in der Abfassung dieses Satzes und seines Beweises spreche 
ich meinen herzlichen Dank Herrn Professor L. Fucus aus. 


Tk 4 In diesem Falle ist auch das durch das Element & erzeugte Rechtsideal nicht- 
rivial. 
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dC, gilt, bekommen wir 
Die (0) Dd: 
Damit haben wir bewiesen, dafi > ein nicht-triviales Rechtsideal von R ist. 
(Sogar ist ) wegen seiner Definition auch ein nicht-triviales Ideal von R.) 
3. Wenn (2) unter den Elementen von a nur fiir £0 erfiillt ist, dann 
mu} fiir jedes Element &(=-0, €a) (3) bestehen. Gibt es ein Element 5(420) 
in a, woftir neben (3) auch 


(4) Co=—)) (E+ 0, €a) 
erfiillt ist, wo @ ein vom Nullelement verschiedenes Element in R bezeichnet, 
so ist wegen (3) und (4) das annullierende Rechtsideal rg des obigen Ele- 
mentes §(==0, €a) vom Nullideal und von R verschieden, deshalb ist re ein 
nicht-triviales Rechstideal von R. 

4. Wenn zuletzt fiir jedes Element §(=-0) von a die Bedingung (3) 
gilt, und (4) fiir jedes €(==0, €a) nur mit dem Element 0 —O besteht,’ dann 
wird das annullierende Linksideal {, von a ein nicht-triviales Rechtsideal von 
R sein. Es ist gleich einsehbar, da {, ein Rechtsideal von R ist. Ferner gibt 
es wegen (3) ein Element ¢ in R, wofitir 

Ee (EE 0, Ea) 
gilt. Zu einem gegebenen Element &(=-0,€«a) finden wir nur ein einziges 
Element «. Wenn namlich auch §7)==6 erfiillt ist, so bekommen wir 

s(-—1) — 0, 
woraus wegen unserer Voraussetzung ¢—7—0, d.h. 

é=7] 
folgt. Wir werden jetzt nachweisen, dai das Element ¢ ein linksseitiges Eins- 
element in R ist. Wegen S¢—§ ist fiir jedes Element e(¢€ R) die Gleichung 
Eso — £o erfiillt, deshalb gilt auch 

S(¢e—o) —0, 
woraus wieder wegen unserer Voraussetzung 
&0——0 (0 €R) 
folgt. Da das Element « wegen ¢a—a--(0) in [, nicht enthalten ist, ist [, 
von R verschieden. 
Bezeichne &’(€ R) ein Element, wofiir 


ces Snes Cop 
giiltig ist. Wir behaupten, dai auch 
6) s5—é EER, &€a) 


5 Es ist nicht schwer auch folgendes zu beweisen: Es sei a ein nicht-triviales Links-- 
ideal vom Ringe R. Wenn fiir jedes Element £(+- 0) von a die Bedingung (3) gilt, und fiir 
jedes &(+0, €a) (4) nur mit dem Element o=—0 besteht, so ist a ein Schietkorper und 
das annullierende Linksideal [4 von a ist von dem Nullideal verschieden. Ferner ist a==Re, 
wo « das Einselement in a und zugleich ein linksseitiges Einselement in F ist. 
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besteht. Da 


E(8) — GE)E =e —E 


ist, deshalb ist auch (5) wegen €s—E und wegen der Eindeutigkeit von € 
richtig. Aus £€a und (5) folgt, daB das linksseitige Einselement « im Links- 
ideal a enthalten ist. Wegen «€a und a-+-R gibt es mindestens ein Element 
o in R mit 

0& +0 (0 € R). 
Da es wegen «= « fiir das Element oe—o(=+ 0, € R) 

(oe«—o)e=0 

erfiillt ist, ist das Element es—o(--0,€f) ein linksseitiges Annullator von 


¢a—a, deshalb ist das annullierende Linksideal {, von a auch vom Nullideal 
verschieden. Somit haben wir Satz 1 bewiesen. 


BEISPIELE. 1. Im vollen Matrizenring K, des Ranges 4 iiber einem 
Schiefkérper K bildet die Menge a aller Matrizen i 4 (a,6€ K) ein nicht- 
triviales Linksideal. Bezeichne 1 das Einselement von K. Z.B. ist fiir das 

10 
Element ¢ = i a} (é (1) 


ak, 
ein nicht-triviales Rechtsideal von K,. (Fall 1.) 
2. Im Ringe R bestehend aus den Elementen 0,¢,¢,¢-+-@ mit den 
definierenden Relationen 
ata=—~+e=0, @=a, e8=8, fe=—f—0 
ist 6 — (0, ?) ein nicht-triviales Linksideal. Wegen SR—(Q) ist @R ein  tri- 
viales Rechtsideal in R, aber der Durchschnitt des Linksideals b und des 


annullierenden Linksideals {, von R ist ein nicht-triviales Rechtsideal von R. 
(Fall 2.) 


Fiir das nicht-triviale Linksideal a— (0, @) ist das annullierende Links- 
ideal {, von a ein nicht-triviales Rechtsideal von R. (Fall 4.) 


§3 
Nachher werden wir die ahnlichen Ergebnisse fiir die Quasiideale bekannt- 


machen. Ahnlich zu der erwahnten Folgerung des obigen Satzes von SZELE gilt 


Satz 2. Enthdlt der Ring R mindestens ein nicht-triviales Quasiideal, 


so besitzt er mindestens auch ein nicht-triviales Linksideal und _nicht-triviales 
Rechtsideal. 


Zum Beweis des Satzes 2 benutzen wir den folgenden 


Satz 3. Der Schiefkérper K hat nur triviale Quasiideale. 
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Bewels. Es sei a(-++(0)) ein Quasiideal von A. Betrachten wir ein 

beliebiges Element @(+-0) in a. Da die Gleichungen 

LES X= Te (a€a; 4,§&7€K) 
fiir jedes Element x von K lésbar sind, deshalb ist x in ak und Ka enthal- 
ten. Also ist x(€ AK) nach (1) ein Element von a, d.h. a= K. 

BEWEIS DES SATZES 2. Es ist klar, daB es den Fall des Linksideals. zu 
betrachten geniigt. Im Gegensatz zu unserer Behauptung setzen wir voraus, 
dafi R mindestens ein nicht-triviales Quasiideal aber kein nicht-triviales Links- 
ideal enthalt. Dann ist R nach dem Satz von SZELE entweder ein Schiefkér- 
per oder ein Zeroring mit p Elementen, wobei p eine Primzahl bezeichnet. 
Nach Satz 3 hat ein Schiefkérper nur triviale Quasiideale. Da ein Zeroring 
mit p Elementen nur triviale Quasiideale besitzt, deshalb mui R wegen 
dieses Widerspruchs mindestens ein nicht-triviales Linksideal enthalten. 

Jetzt werden wir aus einem gegebenen nicht-trivialen Quasiideal des 
Ringes FR je ein nicht-triviales Links- und Rechtsideal von R genau bestimmen. 
Wegen Satz 1 kénnen wir uns auf den Fall beschranken, in dem das Quasi- 
ideal von R kein einseitiges Ideal von R ist. 

SATZ 4. Wenn das nicht-triviale Quasiideal « kein einseitiges Ideal vom 
Ringe R ist, so ist Ra ein nicht-triviales Linksideal und aR ein nicht-triviales 
Rechtsideal von R.* 

Zum Beweis des Satzes 4 benutzen wir den folgenden 

HILFSSATZ 2. Wenn es fiir das Quasiideal «a des Ringes R entweder 
al Ra oder aC aR gilt, so ist « der Durchschnitt eines Linksideals und eines 
Rechtsideals, ferner ist auch 
(4) a==(a, Ra)n(a, aR) 
erfiillt.! 

Beweis. Wir kénnen uns auf den Fall a©@ Ra beschranken, weil der 
Fall aCaR analog ist. Es bezeichne D den Durchschnitt von (a, Ra) und 
(a,aR), d. h. 


(5) D=(a, Ra)n(a, aR). 

Aus (5) folgt 

(6) aS D, 

Wegen der Voraussetzung a Ra ergibt sich statt (5) 
(5’) D= Ran(a, ak). 


6 Es ist klar, daB der Satz 2 ein Korollar des Satzes 4 und der Folgerung des 
Satzes von Szete ist, es war jedoch zweckmaBig fiir Satz 2 einen selbstandigen Beweis: 


zu geben. 
, 7 Aus dem Hilfssatz 2 folgt sofort das folgende Korollar: Wenn der Ring FR ein 


einseitiges Einselement enthalt, so sind alle Quasiideale von R als Durchschnitt eines Links- 
ideals und eines Rechtsideals darstellbar. 
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Betrachten wir jetzt ein beliebiges Element oO von D. Wegen (5’) kénnen wir 
das Element 0 in der Form 


(7) md 3; J («, Cs ; € a 5 Oj, O; € R) 


schreiben. Das Element 


j=l i=! 
we 


gehért wegen > oa, ¢€ Ra zum Modul Ra und wegen der Definition auch 


zu a, weshalb > Bo; nach (1) ein Element von a ist. Daraus folgt nach 
Sook 


(7), dai 0(€ D) in a enthalten, d. h. 
(8) DEa 


ist. Die Bedingungen (6) und (8) beweisen gerade die Behauptung (4), womit 
der Beweis beendet ist. 

BEWEIS DES SATZES 4. Selbstverstindlich ist es genug die Behauptung 
fiir Ra nachzuweisen. Im Gegensatz zu unserer Behauptung setzen wir voraus, 
daf Ra ein triviales Linksideal von R ist, d.h. entweder Ra = (0) oder Ra=R 
gilt. Da a wegen der Voraussetzung kein Linksideal ist, ist der Fall Ra—(O) 
unméglich, also mu Ra-=R bestehen. Folglich ist a[© Ra und der Hilfs- 
satz 2 ist anwendbar. Nach (4) bekommen wir jetzt 


a= Rn(a, aR)= (a, aR), 


woraus aRCa folgt, was bedeutet, dah a im Gegensatz zu unserer Voraus- 
setzung ein Rechtsideal von R ist. Damit haben wir Satz 4 bewiesen. 


(Eingegangen am 28. Juli 1955.) 
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